×ß½ø°²È«ÐÐÒµ´óÄ£ÐÍ

·¢²¼Ê±¼ä 2024-04-11
×ÔChatGPT·¢²¼ÒÔÀ´ £¬Î§ÈÆ´óÄ£ÐÍ £¬¸öÈË¡¢ÆóÒµÄËÖÁ¹ú¼Ò £¬¶¼ÏÝÈëÓú·¢¾çÁҵıä¸ïÖС£ËüµÄÓ°ÏìÁ¦ÒѾ­Ô¶³¬¼¼Êõ·¶³ë £¬³ÉΪȫÇò¼¼Êõ¡¢²úÒµºÍ¹ú¼Ê¾ºÕùµÄ×ÛºÏÕ½³¡¡£È»¶ø £¬´óÄ£Ð͵ÄÂ䵨²¢·ÇÒ»·«·ç˳ £¬´ÓÐÐÒµÊý¾ÝµÄÊÕ¼¯µ½Êµ¼ÊÓ¦Óó¡¾°µÄ½áºÏ £¬Ëƺõÿһ²½Íƽø¶¼ÃæÁÙ×ŶàÖØÄÑÌâ¡£±¾ÎÄÖ÷Òª½éÉÜ»ù´¡´óÄ£ÐͺÍÐÐÒµ´óÄ£Ð͵ıØÒªÐÔ £¬²¢Í¨¹ýL0-L2·Ö²ã¼Ü¹¹À´¼ÓËÙ´óÄ£ÐÍÂ䵨½ø³ÌÒÔ¼°°²È«´óÄ£Ð͵ÄÓ¦Óó¡¾°µÈÄÚÈÝ £¬ÒÔ±ã°ïÖú´ó¼Ò¸üºÃµØÀí½âºÍÂ䵨´óÄ£ÐÍ¡£

ÔÚ´óÄ£ÐͳöÏÖ֮ǰ £¬ÒÔ»úÆ÷ѧϰ¡¢Éî¶Èѧϰ¡¢¹æÔòÍÆÀíµÈΪ´ú±íµÄÈ˹¤ÖÇÄܼ¼ÊõÒѾ­¹ã·ºÓ¦ÓÃÓÚÍøÂ簲ȫÁìÓòÁË¡£ÄÇôΪʲô»¹ÐèÒª´óÄ£ÐÍÄØ£¿


ΪʲôÐèÒª´óÄ£ÐÍ£¿


ÒòΪ´óÄ£ÐͲ»½ö¾ß±¸Í¨ÓÃÖÇÄܺÍ֪ʶ £¬»¹¾ß±¸ÖªÊ¶ÕûºÏÌáÈ¡ÄÜÁ¦ºÍÂß¼­Ë¼Î¬ÄÜÁ¦¡£ÀíÏëµÄ´óÄ£ÐÍÏñÊÇÈËÀàµÄÖúÊÖ£¨»òÕß˵¸±¼ÝÊ»£© £¬¶ø²»ÊÇÒ»¸ö¿É¹©²éÔĵŤ¾ßÊé¡£


ÒÔͨ¹ýÉî¶ÈѧϰѵÁ·µÃµ½µÄרÓÃСģÐÍΪÀý¡£Ð¡Ä£Ð͵ÄѵÁ·ÐèÒª´óÁ¿µÄ±ê×¢Êý¾Ý £¬¶øÇÒÖ»Äܽâ¾öµ¥Ò»ÎÊÌâ¡£Ïà±È֮Ϡ£¬´óÄ£Ð͵ÄͨÓÃÐÔÁé»îºÜ¶à £¬ÉõÖÁÖ»ÐèÒª¼¸Ìõ¼òµ¥µÄÑùÀý £¬¾ÍÄܾ߱¸ÐÂÄÜÁ¦ £¬Õâ¾ÍʹµÃ´óÄ£ÐÍÓиü¹ã·ºµÄÓ¦Óó¡¾°¡£


OpenAIÔÚ2020ÄêÌá³öµÄËõ·Å¶¨ÂÉ£¨Scaling Law£©Ö¸³ö £¬Ä£Ð͵Ä×îÖÕÐÔÄÜÖ÷ÒªÓë¼ÆËãÁ¿ £¬Ä£ÐͲÎÊýÁ¿ºÍÊý¾Ý´óСÈýÕßÏà¹Ø £¬¶øÓëÄ£Ð͵ľßÌå½á¹¹£¨²ãÊý/Éî¶È/¿í¶È£©»ù±¾Î޹ء£


¶ø´óÄ£ÐÍÏà±ÈÓÚ֮ǰµÄС²ÎÊýÁ¿ÓïÑÔÄ£ÐÍ £¬ÔÚÒÔÉÏÈý¸ö·½Ãæ¶¼×öÁ˾޴óÌáÉý £¬²¢ÏÔÏÖ³öһЩӿÏÖÄÜÁ¦£¨ÊÀ½ç֪ʶ £¬Ö¸Áî×ñÑ­ £¬Öð²½ÍÆÀíµÈ£©¡£


ͨË×À´½² £¬»ù´¡´óÄ£ÐÍÓɹ㷺µÄͨÓÃÊý¾Ý£¨ÈçÍøÒ³¡¢°Ù¿Æ¡¢Êé¼®µÈ£©ÑµÁ·µÃµ½ £¬ËüÏñÊÇÒ»¸ö¿ÉÒÔºÍÄã¶Ô»°µÄ°Ù¿ÆÈ«Êé £¬Á˽âÈ´²»¾«Í¨¸÷ÖÖ֪ʶ £¬Í¬Ê±¾ß±¸Ò»¶¨µÄÂß¼­Ë¼Î¬ÄÜÁ¦ £¬¶øÕâЩ¶¼ÊǹýÍùСģÐͺÜÄÑ×öµ½µÄ¡£


½ØÖÁ2023Äêµ× £¬¹úÄÚÒÑ·¢²¼µÄͨÓôóÄ£Ðͳ¬¹ýÁË200¸ö £¬ÄÇôΪʲô»¹Òª´òÔìÃæÏòÌØ¶¨ÁìÓò»òÐÐÒµµÄÐÐÒµ´óÄ£ÐÍÄØ£¿


ΪʲôÐèÒªÐÐÒµ´óÄ£ÐÍ?


ÉÏÎÄÌáµ½ÁËÀíÏëµÄ´óÄ£ÐÍËù¾ß±¸µÄÄÜÁ¦¡£È»¶ø £¬ÐÔÄÜÊÜÏÞÓÚËõ·Å¶¨ÂÉ £¬»ù´¡´óÄ£ÐÍʵ¼ÊÓ¦ÓÃÆðÀ´È´²¢Ã»ÓÐÏëÏóÖÐÄÇôµÃÐÄÓ¦ÊÖ¡£´óÄ£ÐÍʹÓÃͨÓÃÓïÁÏ¿â½øÐÐѵÁ· £¬¶ø°²È«ÐÐÒµµÄÊý¾Ýͨ³£ÊÇÌØÊâÇÒÓÐÏ޵ġ£


Õâµ¼Ö LLM ȱ·¦°²È«Ïà¹ØÊý¾ÝºÍרҵ֪ʶ £¬¶ÔÌØ¶¨°²È«ÎÊÌâµÄÀí½âÄÜÁ¦ØÑ·¦ £¬ÎÞ·¨Ìṩ׼ȷ»òÉîÈëµÄרҵ½âÊÍ¡£


Ñо¿±íÃ÷ £¬Í¨ÓôóÄ£ÐÍÔÚ°²È«ÎÊÌâÉÏÉú³É´ð°¸µÄ׼ȷÂÊ´ó¶¼²»×ã50% £¬¶ÔÖÐÎÄÎÊÌâ»Ø´ðµÄ׼ȷÂʸüµÍ¡£ÏÂͼչʾµÄÊDz»Í¬Ä£ÐÍÔÚÍøÂ簲ȫÎÊÌ⼯ÉϻشðµÄ׼ȷÂÊ£º


mansion88Ã÷Éý|Ö÷Ò³



ͼƬÀ´Ô´£ºMiao, Yukai, et al. "An Empirical Study of NetOps Capability of Pre-Trained Large Language Models." arXiv preprint arXiv:2309.05557 (2023)


Òò´Ë £¬Í¨¹ýÔöÁ¿Ô¤ÑµÁ·£¨Continuous Pre-train £¬CPT£©µÈ¼¼ÊõΪ´óÄ£ÐÍ×¢È밲ȫÐÐҵ֪ʶ £¬¾Í³ÉΪÁ˰²È«ÐÐÒµ´óÄ£ÐÍÓ¦ÓõıØÒªÊֶΡ£È±ÉÙÕâ¸ö²½ÖèÖ±½Ó¶ÔºóÐø°²È«ÈÎÎñ×ö¼à¶½Î¢µ÷£¨Supervised Fine-tuning £¬SFT£© £¬´óÄ£ÐÍÔò»ò¶à»òÉÙ»áÃæÁÙ֪ʶØÑ·¦µÄÎÊÌâ £¬Ëæ¼´³öÏÖ¡°»Ã¾õ¡±ÏÖÏó £¬¶Ô²»¶®µÄÎÊÌâ×ö³öÒ»±¾Õý¾­µÄ»Ø´ð¡£


´ÓÇ°ÃæµÄÃèÊö¿ÉÒÔ¿´³ö £¬Í¬Ñù¶¼½Ð¡°´óÄ£ÐÍ¡± £¬µ«¾ßÌ庬ÒåºÍÊÊÓ÷¶Î§ÉÏÊÇ´æÔÚ²îÒìµÄ¡£ÄÇô´óÄ£ÐÍ»¹ÓÐÄÄЩ²ã´Î»®·ÖÄØ£¿


L0-L2´óÄ£ÐÍ·Ö²ã¼Ü¹¹


ΪÁ˼ÓËÙ´óÄ£ÐÍÂ䵨½ø³Ì £¬¿É½«´óÄ£ÐÍ»®·ÖΪL0»ù´¡´óÄ£ÐÍ¡¢L1ÐÐÒµ´óÄ£ÐÍ¡¢L2Ó¦ÓôóÄ£ÐÍÈý¸ö²ã´Î£º


L0»ù´¡´óÄ£ÐÍ£ºÖ÷Òª°üº¬Ê¹ÓÃͨÓÃ֪ʶԤѵÁ·µÃµ½µÄ»ù×ùÄ£ÐÍ£¨Èç¾ÅÌì¡¢ÎÄÐÄÒ»ÑÔ¡¢Í¨ÒåǧÎʵȣ© £¬ÓÃÀ´Îª´óÄ£Ð͵Ļù´¡ÄÜÁ¦Ìṩ֧³Å¡£L1ÐÐÒµ´óÄ£ÐÍ£ºÔòÊÇʹÓÃÐÐҵ֪ʶÔöÁ¿Ô¤ÑµÁ·µÃµ½ÐÐҵģÐÍ £¬Îª´óÄ£ÐÍ×¢ÈëÁìÓò֪ʶ¡£ÔÚ°²È«ÐÐÒµ £¬ÎÒÃÇÐèÒªµÄ¾ÍÊǰ²È«´óÄ£ÐÍ¡£L2Ó¦Óó¡¾°£ºÊÇͨ¹ý¸÷ÖÖ¼¼ÊõʹL1ÐÐÒµ´óÄ£ÐÍÊÊÅäÓÚÏÂÓÎÓ¦Óó¡¾°µÄ·½Ê½ £¬×¨×¢ÓÚÔÚÌØ¶¨ÈÎÎñÉÏÈ¡µÃÓÅÐãµÄЧ¹û¡£


ͨË×À´½² £¬L0»ù´¡´óÄ£ÐÍÏñÊÇѧϰËùÓпÆÄ¿µÄ¸ßÖÐÉú £¬L1ÐÐÒµ´óÄ£ÐÍÀàËÆÓÚÑ¡¶¨×¨ÒµµÄ´óѧÉú £¬L2Ó¦ÓôóÄ£ÐÍÔòÊÇÑ¡¶¨Ìض¨·½ÏòµÄÑо¿Ô±¡£ÕâÖּܹ¹µÄÓÅÊÆÔÚÓÚ £¬½«´óÄ£ÐÍÓ¦ÓÃÓÚÒµÎñµÄ²½ÖèÁ÷³Ì»¯ £¬¼ÓËÙÕûÌåÂ䵨½ø³Ì £¬½µµÍÂ䵨³É±¾¡£Í¬Ê± £¬¶ÔÓÚL0-L2²ã´ÎµÄ»®·Ö £¬Ò²ÈÃÒµÎñÊý¾ÝµÄ³Áµí¸ü¼ÓÓÐÌõÀí £¬·½±ãÊý¾Ý²»¶Ï»ØÁ÷µ½´óÄ£ÐÍ £¬²»¶ÏÓÅ»¯´óÄ£ÐÍÖÇÄÜˮƽ¡£


mansion88Ã÷Éý|Ö÷Ò³



ÔÚÎÒÃǹØ×¢µÄÍøÂ簲ȫÁìÓò £¬ÓÐÁ˰²È«´óÄ£Ðͺó £¬¾ßÌå¿ÉÒÔÓ¦ÓÃÔÚÄÄЩ³¡¾°ÖÐ £¬Îªmansion88Ã÷ÉýÈÕ³£¹¤×÷´øÀ´ÄÜÁ¦ºÍЧÂʵÄÌáÉýÄØ£¿


°²È«´óÄ£Ð͵ÄÓ¦Óó¡¾°


°²È«´óÄ£ÐÍÔÚL2²ãÃæ¾ßÓй㷺µÄÓ¦Óó¡¾°¡£°²È«´óÄ£ÐÍͨ³£ÔÊÐíÓû§Í¨¹ý×ÔÈ»ÓïÑÔÊäÈëµÄ·½Ê½Íê³É°²È«ÔËÓªµÄÈÕ³£²Ù×÷ £¬¸ù¾ÝÓû§ÊäÈë £¬°´Ðèµ÷ÓÃÒÑÓеÄСģÐͺͲúÆ·¹¦ÄÜ £¬ÊµÏÖ´óСģÐÍЭͬµÄÖÇÄÜËã·¨Ìåϵ¡£


ÕâÖÖ×ÔÈ»ÓïÑÔµ÷Óù¦ÄÜÄ£¿éµÄ·½Ê½ £¬¿ÉÒÔÀûÓôóÄ£Ð͵Ä֪ʶ´¢±¸ºÍÀí½âÍÆÀíÄÜÁ¦ £¬ÎªÁìÓòÎÊÌâÌṩרҵµÄ½â¾ö·½°¸¡£Í¬Ê± £¬¶ÔÓÚÒѾ­ÓÐÏà¹Ø¾­ÑéµÄ°²È«×¨¼Ò £¬Ôò¿ÉÒÔͨ¹ý´óÄ£ÐÍÌáÉý³£¹æ·ÖÎö¹¤×÷µÄЧÂÊ¡£¼´¡°°ïÖúÆÕͨÈ˳ÉΪר¼Ò £¬°ïÖúר¼ÒÌáÉýЧÂÊ¡±¡£


ÏÂÃæÁоÙһЩ³£¼ûµÄ°²È«´óÄ£ÐÍÓ¦Óó¡¾°£º 


Ó¦Óó¡¾°1£º°²È«ÔËÓª

  

°²È«±¨¸æ£º´óÄ£ÐÍÍùÍù¿ÉÒÔÔÚ¼¸·ÖÖÓÄÚ»ã×ÜÖ¸¶¨·¶Î§ÄÚµÄËùÓи澯ʼþ £¬²¢ÇÒÉú³É×ÛºÏÐÔ°²È«±¨¸æ £¬¹©°²È«×¨¼Ò²é¿´¡£


¸æ¾¯½â¶Á£ºÊµÏÖ¶ÔÓÚ°²È«Ê¼þµÄ¹Ø¼üÒªËØ £¬°üÀ¨¸æ¾¯ÄÚÈÝ¡¢Ê¼þÀàÐÍ¡¢¹¥»÷ÊÖ·¨¡¢×ʲúÊôÐԵȽøÐÐרҵ·ÖÎöºÍ½â¶Á £¬Éú³É½â¶Á±¨¸æ £¬¸¨ÖúÓû§¸æ¾¯ÑÐÅС£


¸æ¾¯ËÝÔ´£º¶ÔÓÚÌØÊâµÄ¸æ¾¯ £¬°²È«×¨¼Ò¿ÉÒÔͨ¹ý´óÄ£ÐͽøÐнøÒ»²½ËÝÔ´·ÖÎö £¬ÒªÇó´óÄ£Ð͸ù¾ÝÖÕ¶ËÈÕÖ¾Éú³ÉËÝԴͼµÈ¡£


ÏìÓ¦´¦Ö㺻ùÓÚʼþÐÅÏ¢ºÍ°²È«É豸²¿ÊðÐÅÏ¢ £¬ÓÉ´óÄ£ÐÍ×Ô¶¯Éú³Éʼþ´¦ÖòßÂÔ £¬Éϱ¨Óû§½øÈ¥Ð޸ĻòÈ·ÈÏ £¬ ʵÏÖ¶Ô¹¥»÷ÐÐΪµÄ¿ìËÙÏìÓ¦¡£


Ó¦Óó¡¾°2£ºÖªÊ¶ÕûºÏ


°²È«Ç鱨£º´óÄ£ÐÍ¿ÉÒÔÀûÓÃÕûºÏ²»Í¬À´Ô´µÄ°²È«Ç鱨Դ £¬²¢ÔÚÓû§»·¾³ÖÐ×Ô¶¯ÊÊÅä¡£ÔÚ°²È«×¨¼Ò½øÐÐʼþµ÷²éʱ £¬Îª°²È«¸æ¾¯ÌṩÉÏÏÂÎÄ¡£


°²È«ÎÊ´ð£ºÍ¨¹ý¹¹½¨°²È«ÖªÊ¶¿â £¬´óÄ£ÐÍ¿ÉÒԻشðÓû§µÄ°²È«ÎÊÌâ¡£Óû§¿ÉÒÔ²éѯ¸÷ÖÖÍøÂ簲ȫ¡¢Ö÷»ú°²È«µÈ·½ÃæµÄÎÊÌâ £¬²¢´Ó»Ø´ðÖлñȡרҵµÄ°²È«ÐÅÏ¢ºÍ½¨Òé¡£ 


Ó¦Óó¡¾°3£º´úÂë¹ÜÀí


©¶´ÍÚ¾ò£ºÍ¨¹ýѧϰ´óÁ¿´úÂëºÍ©¶´°¸Àý £¬´óÄ£ÐÍ¿ÉÒÔ»ýÀ۷ḻµÄ©¶´´úÂë·ÖÎö¾­ÑéºÍרҵ֪ʶ £¬´Ó¶ø·¢ÏÖ´úÂëÖдæÔÚµÄDZÔÚ©¶´»ò·çÏÕ¡£


©¶´ÐÞ¸´£º´óÄ£ÐÍ¿ÉÒÔ¸ù¾Ý©¶´·ÖÎö½á¹û £¬Éú³É²¹¾È²½Öè¡¢×Ô¶¯Ö´Ðи´ÔӵķçÏÕ»º½â»î¶¯»òÔÚÎÞÐèÓû§½»»¥µÄÇé¿öÏÂÐÞ²¹Èí¼þ £¬Õâ´ó´ó¼Ó¿ìÁ˹ÜÀí©¶´ºÍÌá¸ß×éÖ¯°²È«ÐÔµÄËÙ¶È¡£


¶ñÒâ½Å±¾£º´óÄ£ÐÍ¿ÉÒÔ·ÖÎöºÍ½âÊͶñÒâ½Å±¾ÐÐΪ £¬Ð­ÖúÓû§·¢ÏÖ´æÔÚÍþвµÄ½Å±¾¡£ËüÔÊÐíÓû§µ¼Èë½Å±¾²¢·ÖÎöÆäÊÇ·ñ´æÔÚ¶ñÒâÐÐΪ £¬¼ì²âºÍ»º½âDZÔÚÍþв £¬±ê¼Ç©±¨ºÍÇå³ýÎ󱨡£ 


Ó¦Óó¡¾°4£ººÏ¹æ¼à¿Ø


ºÏ¹æÉ󼯣ºÐí¶àÆóÒµ±ØÐë×ñÊØÐÐÒµ±ê×¼ÒÔ±£»¤¹«Ë¾Êý¾Ý²¢Âú×ã¼à¹ÜÒªÇó £¬È˹¤ÉóºËͨ³£½ÏΪ·¦Î¶ £¬´óÄ£ÐÍ¿ÉÒÔ°ïÖúÆÀ¹À×éÖ¯¶ÔÐÐÒµ±ê×¼¡¢·¨¹æÒªÇóºÍÄÚ²¿²ßÂԵĺϹæÐÔ¡£


Êý¾Ý´óÆÁ£º´óÄ£ÐÍ¿ÉÒÔ×Ô¶¯Éú³ÉÕâЩÊý¾Ý´óÆÁÀ´¼à¿Ø×éÖ¯Êý¾ÝµÄºÏ¹æÐÔ £¬¿ÉÒÔ°ïÖú°²È«×¨¼ÒÇáËɸú×ٺϹæÄ¿±êµÄ½ø¶È²¢ÏòÉóºËԱչʾ¡£


ºÏ¹æÐÞ¸´£º´óÄ£ÐÍ¿ÉÒÔͨ¹ýºÏ¹æÐÔÉ󼯽á¹û £¬ÌṩÏàÓ¦µÄÐÞ¸´½¨Òé £¬°ïÖúÆóÒµ´ïµ½¼à¹Ü±ê×¼¡£


³ÖÐø¸üУºËæ×ÅÐÐÒµ±ê×¼µÄ¸üк͹ÜÀí»ú¹¹¸ü¸ÄÆä·¨¹æÒªÇó £¬ºÏ¹æÉó¼ÆÍùÍùÐèÒª×ö³öÏàÓ¦±ä»¯¡£´óÄ£ÐÍ¿ÉÒÔ¿ìËٵĸú½øÕâЩ±ä»¯ £¬²¢Ìṩָµ¼½¨Òé¡£