ÆÀ¹ÀÓÃÓÚÔ×ÓÁ¦ÏÔÎ¢¾µ×Ô¶¯»¯µÄ´óÐÍÓïÑÔÄ£ÐÍ´úÀí - »úÐµÂÛÎÄ - Ò»ÆðÓ®ÂÛÎÄ¸¨µ¼Íø--×¨Òµ´úÐ´´ú·¢SCI¡¢EI¡¢ºËÐÄÆÚ¿¯¡¢´úÐ´MBA¡¢Ë¶²©±ÏÒµÂÛÎÄ¡£QQ910330594

»¶Ó·ÃÎÊÒ»ÆðÓ®ÂÛÎÄ¸¨µ¼Íø

¼ÓÈëÊÕ²Ø | ÉèÎªÖ÷Ò³ | ÁªÏµÎÒÃÇ

±¾Õ¾¶¯Ì¬

¸ü¶à

ÁªÏµÎÒÃÇ

¸ü¶à

QQ£º3949358033

Î¢ÐÅ£ºpaperwinner

¹¤×÷Ê±¼ä£º9:00-24:00

³É¹¦°¸Àý

¸ü¶à

»úÐµÂÛÎÄ

µ±Ç°Î»ÖÃ£ºÊ×Ò³ > »úÐµÂÛÎÄ

ÆÀ¹ÀÓÃÓÚÔ×ÓÁ¦ÏÔÎ¢¾µ×Ô¶¯»¯µÄ´óÐÍÓïÑÔÄ£ÐÍ´úÀí

À´Ô´£ºÒ»ÆðÓ®ÂÛÎÄÍø ÈÕÆÚ£º2025-11-10 ä¯ÀÀÊý£º341 ¡¾ ×ÖÌå£º ´ó ÖÐ Ð¡ ¡¿

ÆÀ¹ÀÓÃÓÚÔ×ÓÁ¦ÏÔÎ¢¾µ×Ô¶¯»¯µÄ´óÐÍÓïÑÔÄ£ÐÍ´úÀí

´óÐÍÓïÑÔÄ£ÐÍ £¨LLM£© ÕýÔÚÍ¨¹ýÖ§³Ö¿ÉÒÔ¼ÓËÙ²ÄÁÏÑÐ¾¿µÄ×Ô¶¯¼ÝÊ»ÊµÑéÊÒ £¨SDL£© À´¸Ä±äÊµÑéÊÒ×Ô¶¯»¯¡£È»¶ø£¬µ±Ç°µÄ SDL ÊµÊ©ÒÀÀµÓÚ½©»¯µÄÐÒé£¬ÎÞ·¨ÔÚ¶¯Ì¬ÊµÑé»·¾³ÖÐ²¶×½×¨¼Ò¿ÆÑ§¼ÒµÄÊÊÓ¦ÐÔºÍÖ±¾õ¡£ÔÚÕâÀï£¬ÎÒÃÇÕ¹Ê¾ÁË LLM ´úÀí¿ÉÒÔÍ¨¹ýÎÒÃÇµÄÈË¹¤ÖÇÄÜÊµÑéÊÒÖúÊÖ £¨AILA£© ¿ò¼ÜÊµÏÖÔ×ÓÁ¦ÏÔÎ¢¾µ £¨AFM£© ×Ô¶¯»¯¡£´ËÍâ£¬ÎÒÃÇ»¹¿ª·¢ÁË AFMBench——Ò»¸öÈ«ÃæµÄÆÀ¹ÀÌ×¼þ£¬ÔÚ´ÓÊµÑéÉè¼Æµ½½á¹û·ÖÎöµÄÕû¸ö¿ÆÑ§¹¤×÷Á÷³ÌÖÐÌôÕ½ LLM ´úÀí¡£ÎÒÃÇ·¢ÏÖ£¬×îÏÈ½øµÄ·¨Ñ§Ë¶Ê¿ÔÚ»ù±¾ÈÎÎñºÍÐµ÷³¡¾°·½ÃæÓöµ½ÁËÀ§ÄÑ¡£ÖµµÃ×¢ÒâµÄÊÇ£¬ÉÃ³¤²ÄÁÏ¿ÆÑ§ÎÊ´ðµÄÄ£ÐÍÔÚÊµÑéÊÒ»·¾³ÖÐ±íÏÖ²»¼Ñ£¬Õâ±íÃ÷ÁìÓòÖªÊ¶²¢²»ÄÜ×ª»¯ÎªÊµÑéÄÜÁ¦¡£´ËÍâ£¬ÎÒÃÇ¹Û²ìµ½ LLM ´úÀí¿ÉÄÜ»áÆ«ÀëÖ¸Áî£¬ÕâÖÖÏÖÏó±»³ÆÎªÃÎÓÎ£¬Òý·¢ÁË SDL Ó¦ÓÃ³ÌÐòµÄ°²È«¶ÔÆëÎÊÌâ¡£ÎÒÃÇµÄÏûÈÚ±íÃ÷£¬¶àÖÇÄÜÌå¿ò¼ÜµÄÐÔÄÜÃ÷ÏÔÓÅÓÚµ¥ÖÇÄÜÌå·½·¨£¬¾¡¹ÜÁ½Õß¶¼¶ÔÖ¸Áî¸ñÊ½»òÌáÊ¾µÄÎ¢Ð¡±ä»¯ÈÔÈ»Ãô¸Ð¡£×îºó£¬ÎÒÃÇÆÀ¹ÀÁËAILAÔÚÈÕÒæÏÈ½øµÄÊµÑéÖÐµÄÓÐÐ§ÐÔ——AFMÐ£×¼¡¢ÌØÕ÷¼ì²â¡¢»úÐµÐÔÄÜ²âÁ¿¡¢Ê¯Ä«Ï©²ã¼ÆÊýºÍÑ¹Í·¼ì²â¡£ÕâÐ©·¢ÏÖÈ·¶¨ÁËÔÚ²¿Êð LLM ´úÀí×÷Îª¿ç¿ÆÑ§Ñ§¿ÆµÄ×ÔÖ÷ÊµÑéÊÒÖúÀíÖ®Ç°½øÐÐ»ù×¼²âÊÔºÍÎÈ½¡°²È«ÐÒéµÄ±ØÒªÐÔ¡£

ÆäËûÈËÕýÔÚ²é¿´µÄÀàËÆÄÚÈÝ

ÖØÐÂË¼¿¼´óÐÍÓïÑÔÄ£ÐÍµÄ»úÆ÷Ñ§Ï°

µÚ17Ìõ 2025Äê2ÔÂ17ÈÕ

²ÄÁÏ·¢ÏÖµÄ»ù´¡Ä£ÐÍ——ÏÖ×´ºÍÎ´À´·½Ïò

ÎÄÕÂ ¿ª·Å»ñÈ¡ 06 ÈýÔÂ 2025

»ùÓÚ·ÖÀàµÄ²¢·¢APIµ÷ÓÃÓëAIÖÇÄÜÌå¹¤¾ßÔöÇ¿LLM×îÓÅÄ£ÐÍ×éºÏÑÐ¾¿

ÎÄÕÂ ¿ª·Å»ñÈ¡ 01 ÆßÔÂ 2025

½éÉÜ

¿ÆÑ§ÊµÑéÐèÒª×¿Ô½µÄÁìÓò×¨ÒµÖªÊ¶£¬´ÓÌ½Ë÷»ò¼ÙÉèÇý¶¯µÄÊµÑéÉè¼Æµ½¾«È·Ö´ÐÐºÍÑÏ¸ñµÄÊý¾Ý·ÖÎö¡£ÕâÖÖ¸´ÔÓÐÔ¸ø¿ÆÑ§·¢ÏÖ´øÀ´ÁËÆ¿¾±£¬ÌØ±ðÊÇËæ×ÅÊµÑé¼¼Êõ±äµÃÔ½À´Ô½¸´ÔÓ¡£´óÐÍÓïÑÔÄ£ÐÍ £¨LLM£© µÄ³öÏÖÍÆ¶¯ÁË×Ô¶¯¼ÝÊ»ÊµÑéÊÒ £¨SDL£© µÄ·¢Õ¹£¬ÕâÐ©ÊµÑéÊÒ¼¯³ÉÁË¶àÖÖÐÅÏ¢Ô´ÒÔ½øÐÐ×Ô¶¯»¯¹æ»®1ºÍÊµÑé¡£ÈË¹¤ÖÇÄÜ £¨AI£© ´úÀí 2,3SDL ÒÑ¾ÔÚ²ÄÁÏ»ò·Ö×Ó·¢ÏÖ·½ÃæÈ¡µÃÁË¶àÏî×³¾Ù 4,5,6£¬ »¯Ñ§ÑÐ¾¿7ºÍÎÞ»ú²ÄÁÏºÏ³É¡£SDL ÊµÏÖ¿É³ÖÐø·¢Õ¹µÄ³ÐÅµ8ÎªÀûÓÃÆäÔÚ¸ßÍ¨Á¿ÊµÑéºÍ·¢ÏÖÖÐµÄÇ±Á¦¸¶³öÁË¾Þ´óµÄÅ¬Á¦9.¼ò»¯ SDL µÄÅ¬Á¦´ßÉúÁË ChemOS µÈ±àÅÅ¼Ü¹¹10.´ËÍâ£¬ÒÑ¾Ö¤Ã÷£¬¿ÉÒÔÍ¨¹ý´¦ÀíÏûÆçÒåµÄÈË»ú½»»¥¿ò¼ÜÀ´ÔöÇ¿ SDL µÄ¹¦ÄÜ£¬´Ó¶øÊµÏÖ¸üºÃµÄ¹æ»®ºÍÖ´ÐÐ 11,12.ËäÈ»»ùÓÚ·¨Ñ§Ë¶Ê¿µÄÊµÑéÊÒÖúÀíµÄÔçÆÚÑÝÊ¾ÏÔÊ¾³öÔÚ»¯Ñ§ºÍ²ÄÁÏ¿ÆÑ§·½ÃæµÄÇ°¾° 1,2,3£¬³ýÁËÌØ¶¨Ó¦ÓÃ»ò¾ßÓÐÔ¤¶¨ÐÒéµÄÖØ¸´ÓÃÀýÖ®Íâ£¬ËüÃÇµÄÔËÐÐ¿É¿¿ÐÔÔÚºÜ´ó³Ì¶ÈÉÏÈÔÎ´±»ÃèÊö13,14,15,16,17.

Ä¿Ç°µÄÑÐ¾¿Ö÷ÒªÉæ¼°ÓÐ¾Ý¿É²é»òÔ¤¶¨ÒåµÄÐÒéºÍµ¥Ò»Ä¿±êÈÎÎñ£¬Î´ÄÜ²¶×½µ½ÊµÑé¼Æ»®¡¢¶à¹¤¾ßÐµ÷ÒÔ¼°½á¹û½âÊÍ»òÔÚÏß¸ÉÔ¤Ö®¼ä´í×Û¸´ÔÓµÄÏà»¥×÷ÓÃ10.ËäÈ»×î½üÄÉÈë¹æ»®ÔªËØµÄÑÐ¾¿±íÃ÷£¬ÔÚÊµÏÖÌØ¶¨ÊµÑéÄ¿±ê·½ÃæÈ¡µÃÁË³É¹¦£¬µ«ËüÃÇÉÐÎ´ÏµÍ³µØÆÀ¹À SDL ÔÚ¸ü¹ã·ºµÄÊµÑéÊÒ×Ô¶¯»¯ÈÎÎñÖÐµÄ¿É¿¿ÐÔ 13,14.¾¡¹ÜÓÐ¼¸ÏîÑÐ¾¿¶Ô·¨Ñ§Ë¶Ê¿½øÐÐÁË»ù×¼²âÊÔ15,16,17,18,19,20,21,22,23ºÍÊÓ¾õÓïÑÔÄ£ÐÍ13,14,24,25Í¨¹ýÎÊ´ðÐÒéÀ´ÆÀ¹ÀËüÃÇ×÷Îª²ÄÁÏÑÐ¾¿¸±¼ÝÊ»µÄÇ±Á¦£¬Ò»¸ö¹Ø¼üµÄÖªÊ¶²î¾àÈÔÈ»´æÔÚ£ºÁË½âÕâÐ©ÈË¹¤ÖÇÄÜÏµÍ³ÈçºÎ´¦ÀíÐÂµÄÊµÑé³¡¾°¼°Æä»ù±¾¾ÖÏÞÐÔ¡£

ÎªÁËÓ¦¶ÔÕâÒ»ÌôÕ½£¬ÎÒÃÇÔÚÕâÀï½éÉÜ AILA£¨ÈË¹¤ÖÇÄÜÊµÑéÊÒÖúÊÖ£©£¬ÕâÊÇÒ»¸öÓÉ LLM Çý¶¯µÄ¿ò¼Ü£¬²¢Ìí¼ÓÁË×¨ÃÅµÄ¹¤¾ß¡£ÎÒÃÇÑ¡ÔñÁËÉ¨ÃèÌ½ÕëÏÔÎ¢¾µ18£¬ÌØ±ðÊÇÔ×ÓÁ¦ÏÔÎ¢¾µ £¨AFM£©£¬¼øÓÚÆä¹ÌÓÐµÄ¸´ÔÓÐÔºÍÔÚ²ÄÁÏÑÐ¾¿ÖÐµÄ¹ã·ºÊÊÓÃÐÔ£¬×÷ÎªÎÒÃÇµÄÊµÑéÊÔÑéÌ¨¡£ÓÉÓÚÈË¹¤ÖÇÄÜºÍÈË»ú½»»¥·½·¨ÔÚ²ÄÁÏ±íÕ÷ÖÐµÄ¹ã·ºÓ¦ÓÃ£¬ÈËÃÇÒÑ¾×ö³öÁË¶àÖÖÅ¬Á¦À´×Ô¶¯»¯ÏÔÎ¢¾µ¼¼Êõ26,27,28,29,30,31,32,33,34,35.ÕâÐ©¹¤×÷×¨ÃÅ²àÖØÓÚÍÆ½øÌØ¶¨µÄ×÷·½Ãæ£¬ÀýÈç·ÖÎöÒÆ¶¯ÎïÌå»òÓÅ»¯ÕÕÃ÷Ìõ¼þ£¬ÖØµãÊÇ¸Ä½ø¸ü¹ã·ºµÄÊµÑé·½°¸ÖÐµÄ¸÷¸ö²½Öè¡£³ýÁËÕâÐ©ÓÐÕë¶ÔÐÔµÄ½øÕ¹Ö®Íâ£¬Liu µÈÈË¡£36Ì½Ë÷ LLM ÓëÓ¦ÓÃ³ÌÐò±à³Ì½Ó¿Ú £¨API£© µÄ¼¯³É£¬ÒÔÔöÇ¿É¨ÃèÌ½ÕëÏÔÎ¢¾µÑÐ¾¿ÖÐµÄ¹¤×÷Á÷³Ì×¼±¸¡¢ÒÇÆ÷×÷ºÍÊý¾Ý¿ÉÖØ¸´ÐÔ¡£AFM×÷ÐèÒª¿ç¶à¸öÁìÓòµÄ×¨ÒµÖªÊ¶——´ÓÌ½ÕëÐ£×¼µ½²ÎÊýÓÅ»¯ºÍÊý¾Ý½âÊÍ——Ê¹Æä³ÉÎªÆÀ¹À AI ´úÀí¹ÜÀí¸´ÔÓÊµÑé¹¤×÷Á÷³ÌµÄÄÜÁ¦µÄÀíÏëÆ½Ì¨¡£

Ê¹ÓÃ AFM ×÷ÎªÄ£ÐÍÏµÍ³£¬ÎÒÃÇÍ¨¹ý AFMBench Ì½Ë÷ AILA ÔÚ¿ÆÑ§×Ô¶¯»¯µÄÎå¸ö¹Ø¼ü·½ÃæµÄÄÜÁ¦£ºÊµÑé¹¤×÷Á÷³ÌÉè¼Æ¡¢¶à¹¤¾ßÐµ÷¡¢¾ö²ß¡¢¿ª·ÅÊ½ÊµÑéµÄÖ´ÐÐºÍÊý¾Ý·ÖÎö¡£ÎÒÃÇµÄÏµÍ³ÆÀ¹À½ÒÊ¾ÁË¹Ø¼üµÄ¹ÊÕÏÄ£Ê½ºÍÐèÒª¸Ä½øµÄÁìÓò¡£ÎÒÃÇÍ¨¹ýÎå¸öÊµ¼ÊÊµÑéÖ¤Ã÷ÁË AILA µÄÊµ¼ÊÊµÓÃÐÔ£º£¨1£© Ê¶±ðºÍ·ÖÎö²£Á§ÑùÆ·ÉÏµÄÑ¹ºÛ£¬°üÀ¨ÍÆ¶ÏËùÓÃÑ¹Í·ÀàÐÍ;£¨2£©¹èÆ¬ÉÏÊ¯Ä«Ï©±¡Æ¬µÄ¼ì²âºÍÊ¯Ä«Ï©²ãÊýµÄ²â¶¨;£¨3£©×Ô¶¯ÏÔÎ¢¾µÐ£×¼;£¨4£©Ê¯Ä«Ï©½×ÌÝ±ßÔµµÄ¸ß·Ö±æÂÊ³ÉÏñ;£¨5£©¸ßÈ¡ÏòÈÈ½âÊ¯Ä«£¨HOPG£©µÄ¸ºÔØÏà¹ØÄ¦²Á±íÕ÷¡£

½á¹û

AILA ¿ò¼Ü

AILA µÄ¼Ü¹¹ÓÅÏÈ¿¼ÂÇÄ£¿é»¯£¬´Ó¶øÄÜ¹»Óë²»Í¬µÄÊµÑéºÍ·ÖÎöÆ½Ì¨ÎÞ·ì¼¯³É¡£ÆäºËÐÄÊÇÒ»¸öÓÉ LLM Çý¶¯µÄ¹æ»®Æ÷£¨¸Ã¿ò¼ÜµÄÈÏÖªÖÐÐÄ£©£¬ËüÐµ÷ÓÃ»§½»»¥²¢Ðµ÷×¨Òµ´úÀí£¨Í¼ 1a£©.¸Ã¹æ»®Æ÷Ö±½Ó´ÓÓÃ»§ÄÇÀï»ñÈ¡²éÑ¯²¢È·¶¨´¦ÀíÈÎÎñµÄÊÊµ±´úÀí¡£´úÀíµ÷ÓÃ¹¤¾ßÒÔÖ´ÐÐÍê³ÉÊµÑéËùÐèµÄ²½Öè¡£´úÀíÓë´úÀíÖ®¼äµÄÐµ÷ÓÉÁ½¸ö¹Ø¼ü×Öµ÷ÓÃ£¬¼´“NEED HELP”ºÍ“FINAL ANSWER”¡£Ç°Ò»¸ö±êÖ¾µ÷ÓÃÂ·ÓÉº¯Êý£¬½«Î´½â¾öµÄÈÎÎñ´«Êä¸øÏÂÒ»¸öÊÊµ±µÄ´úÀí£¬¶øºóÒ»¸ö±êÖ¾Ôòµ¼ÖÂÊµÑéÖÕÖ¹¡£Òò´Ë£¬AILA ²ÉÓÃ¶¯Ì¬Â·ÓÉ£¬ÀûÓÃ¿ÉÓÃµÄ´úÀíºÍ¹¤¾ßÀ´Íê³ÉÓÃ»§¸ø³öµÄÈÎÎñ£¨ÓÐ¹ØÆäËûÏêÏ¸ÐÅÏ¢£¬Çë²ÎÔÄ²¹³äÐÅÏ¢ÖÐµÄ S2.4£©¡£

Í¼ 1£ºAILA ¿ò¼ÜºÍÊµÊ©¡£

Í¼1

AILA ÈË¹¤ÖÇÄÜÊµÑéÊÒÖúÊÖ £¨AILA£© µÄÏµÍ³¼Ü¹¹¡£ÐéÏß±íÊ¾ÊÜ AILA ¾ö²ß¿ØÖÆµÄ×ÔÊÊÓ¦ÐÅÏ¢Á÷£¬ÊµÏß±íÊ¾¾ßÓÐÔ¤¶¨ÒåÂ·ÓÉÐÒéµÄÈ·¶¨ÐÔÐÅÏ¢Â·¾¶¡£b Ô×ÓÁ¦ÏÔÎ¢¾µ£¨AFM£©ÊµÑé×°ÖÃµÄÍ¼Ïñ£¬ÏÔÊ¾ÁË¹Ø¼üµÄÓ²¼þ×é¼þºÍ¿ØÖÆ½Ó¿Ú¡£c AILA×÷µÄ´ú±íÐÔÑÝÊ¾£ºÓÃ»§²éÑ¯µÄÔÊ¼¼ÇÂ¼ºÍ AILA Î´¾±à¼µÄÏìÓ¦ÐòÁÐ£¬ÏÔÊ¾ÏµÍ³µÄ²éÑ¯½âÊÍ¡¢ÈÎÎñ¹æ»®ºÍÖ´ÐÐÄÜÁ¦¡£

È«³ß´çÍ¼Ïñ

¶ÔÓÚ AFM×÷£¬AILA ²¿ÊðÁËÁ½ÖÖ´úÀí£ºÓÃÓÚÊµÑé¿ØÖÆµÄ AFM ´¦Àí³ÌÐò´úÀí £¨AFM-HA£© ºÍÓÃÓÚ·ÖÎöµÄÊý¾Ý´¦Àí³ÌÐò´úÀí £¨DHA£©¡£AFM-HA ÓëÎÄµµ¼ìË÷ÏµÍ³½Ó¿Ú£¬¸ÃÏµÍ³°üÀ¨ AFM Èí¼þÎÄµµºÍ´úÂëÖ´ÐÐÒýÇæ£¬¸ÃÒýÇæ½« Python ÃüÁî×ª»»ÎªÊµÑé×÷¡£»ùÓÚPythonµÄAPI½¨Á¢ÁËÓ²¼þ-Èí¼þ½Ó¿Ú£¬ÄÜ¹»Í¨¹ýÌØ¶¨ÓÚ¹©Ó¦ÉÌµÄÐÒéÖ±½Ó¿ØÖÆAFMÏµÍ³£¨Í¼¡£1b£©. DHA Í¨¹ý×¨ÓÃ¹¤¾ß¹ÜÀíÍ¼ÏñÓÅ»¯ºÍ·ÖÎö£ºÍ¼ÏñÓÅ»¯Æ÷ÓÃÓÚÎ¢µ÷±ÈÀý»ý·Öµ¼Êý £¨PID£© ²ÎÊýÒÔÊµÏÖ¸ß±£Õæ³ÉÏñ£¬ÒÔ¼°Í¼Ïñ·ÖÎöÆ÷´ÓÊµÑéÊý¾ÝÖÐÌáÈ¡Ä¿±êÌØÕ÷¡£¶ÔÓÚ´úÀí¹¦ÄÜÖ®ÍâµÄ²éÑ¯£¬¹æ»®Æ÷»áÉú³ÉÌæ´ú·½·¨»ò½¨ÒéµÄ×÷¡£

ÔÚ AFM ÊµÑéÖÐ£¬¹¤×÷Á÷³ÌÍ¨³£Éæ¼°Á½¸ö¹Ø¼ü²½Öè£º²¶»ñÍ¼ÏñºÍ·ÖÎö½á¹û¡£³ÉÏñ²¿·ÖÊ×ÏÈÑ¡ÔñºÏÊÊµÄÐü±Û£¬È»ºóÉèÖÃ³ÉÏñ²ÎÊý¡£È»ºó£¬½«¼â¶ËÇáÇáÒÆÏòÑùÆ·±íÃæ£¬½øÐÐÉ¨Ãè¡£¶ÔÓÚÃ¿¸ö½×¶Î£¬AILA ¶¼»á´´½¨Ò»¸öÌØ¶¨µÄ Python ½Å±¾²¢Ö´ÐÐËü£¬Í¨¹ý API ÊµÊ±¿ØÖÆ AFM ÒÇÆ÷¡£ÕâÖÖÁ¬½ÓÔÊÐíÊý×ÖÃüÁîÖ±½Ó×ª»»ÎªÒÇÆ÷ÉÏµÄÎïÀíÔË¶¯¡£É¨ÃèÍê³Éºó£¬Í¼Ïñ»á×Ô¶¯±£´æ²¢´ò¿ª½øÐÐ·ÖÎö¡£Ã¿¸öÄ£¿éµÄ¼¼Êõ¹æ·¶ºÍÊµÏÖÏ¸½ÚÔÚ·½·¨²¿·Ö½øÐÐÁË½âÊÍ¡£

ÎªÁËÑÝÊ¾AILAµÄ×÷¹¤×÷Á÷³Ì£¬ÎÒÃÇÌá³öÁËÒ»¸ö¶à²½ÖèÊµÑé£º»ñÈ¡HOPGµÄAFMÍ¼Ïñ²¢ÌáÈ¡ÆäÄ¦²ÁºÍ´Ö²Ú¶È²ÎÊý£¨Í¼¡£1c£©. ÕâÏî¿ª·ÅÊ½ÈÎÎñÌåÏÖÁËÏÖÊµÊÀ½çµÄ¸´ÔÓÐÔ£¬Ìá¹©ÁË¶àÖÖ½â¾ö·½°¸Í¾¾¶¡£ÊÕµ½²éÑ¯ºó£¬AILA ½«Æä·Ö½âÎªË³ÐòÄ¿±ê£ºÍ¨¹ý AFM-HA ½øÐÐÍ¼Ïñ²É¼¯£¬È»ºó½øÐÐ DHA Ö÷µ¼µÄ·ÖÎö¡£AFM-HA ¼ìË÷Ïà¹ØÎÄµµ£¬Éú³É¿ÉÖ´ÐÐ´úÂë²¢²¶»ñÍ¼Ïñ¡£³É¹¦²É¼¯ºó£¬AILA ½«¿ØÖÆÈ¨×ª»»Îª DHA£¬ºóÕßÖ¸Ê¾Í¼Ïñ·ÖÎöÆ÷¼ÆËãÖ¸¶¨µÄ²ÎÊý¡£Õâ¸ö¾«ÐÄ±àÅÅµÄÐòÁÐÌåÏÖÁË AILA µÄºËÐÄÓÅÊÆ£ºÄÜ¹»½âÎö¸´ÔÓµÄ×ÔÈ»ÓïÑÔ²éÑ¯¡¢¿ª·¢Õ½ÂÔ¹¤×÷Á÷³ÌÒÔ¼°Ðµ÷¶à¸ö´úÀíÒÔÊµÏÖÊµÑéÄ¿±ê¡£

AFMBench£ºÆÀ¹ÀAILA¿ò¼ÜµÄÈÎÎñ

AFMBench °üº¬ 100 ¸ö×¨Òµ²ß»®µÄÊµÑéÈÎÎñ£¨ÓÐ¹ØÈÎÎñµÄÒ»Ð©Ê¾Àý£¬Çë²ÎÔÄ²¹³äÐÅÏ¢ÖÐµÄ S3.1;ËùÓÐÈÎÎñ¶¼¿ÉÒÔÔÚ GitHub ´æ´¢¿âÖÐÕÒµ½37£©£¬ÊÖ¶¯Éè¼ÆÓÃÓÚÑÏ¸ñÆÀ¹À¶à¸ö¸´ÔÓÎ¬¶ÈµÄ×ÔÖ÷ AFM×÷¡£Óë´«Í³µÄ LLM »ù×¼²âÊÔ»ò»ùÓÚÄ£ÄâµÄÆÀ¹À²»Í¬£¬AFMBench ÈÎÎñÐèÒªÔÚ AFM Ó²¼þÉÏ½øÐÐÎïÀíÖ´ÐÐ£¬´Ó¶øÒýÈëÁËÏÖÊµÊÀ½çµÄÊ±¼äÏÞÖÆºÍÊµÑé±äÒìÐÔ¡£¶ÔÈÎÎñµÄ·ÖÎö½ÒÊ¾ÁË×ÊÔ´ÀûÓÃÂÊºÍ×÷¸´ÔÓÐÔµÄ²»Í¬Ä£Ê½¡£ÔÚÍ¼ÖÐ¡£2a£¬¹¤¾ßÐµ÷ÒªÇóÍ¹ÏÔÁË¶Ô¸´ÔÓ¹¤×÷Á÷³ÌµÄÏµÍ³Æ«ºÃ£¬69% µÄÈÎÎñÐèÒª¶à¹¤¾ß¼¯³É£¬¶ø 31% µÄÈÎÎñÍ¨¹ýµ¥¹¤¾ßÐÒé½øÐÐ×÷¡£´úÀí²¿Êð·ÖÎö½ÒÊ¾ÁËÒ»ÖÖ·Ö²¼£º83% µÄ×÷Ê¹ÓÃµ¥´úÀíÐÒé£¬¶ø 17% µÄ×÷ÐèÒª¶à´úÀíÐµ÷——´Ó¶øÄÜ¹»ÆÀ¹ÀÓÐÕë¶ÔÐÔµÄ×¨ÒµÖªÊ¶ºÍÏµÍ³·¶Î§µÄ¼¯³ÉÄÜÁ¦¡£

Í¼ 2£ºAFMBench ÖÐµÄÈÎÎñ·Ö²¼ºÍÄ£¿éÀûÓÃÂÊ¡£

Í¼2

±ýÍ¼ÏÔÊ¾ÁË»ù×¼ÈÎÎñÖÐ¹¤¾ßÐèÇó£¨×ó£¬µ¥¸öÓë¶à¸ö£©ºÍ´úÀíÐèÇó£¨ÓÒ£¬µ¥¸öÓë¶à¸ö£©µÄ·Ö²¼¡£b×÷¸´ÔÓÐÔ·ÖÀà£¬ÏÔÊ¾»ù±¾ÈÎÎñÓë¸ß¼¶ÈÎÎñµÄ±ÈÀý¡£c Ë®Æ½ÌõÐÎÍ¼Á¿»¯ËùÓÐÈÎÎñµÄÄ£¿é²ÎÓëÆµÂÊ£¬Õ¹Ê¾Ã¿¸ö¹¤¾ßºÍ´úÀíµÄÊ¹ÓÃÄ£Ê½¡£d Î¬¶÷Í¼£¬ËµÃ÷ÎÄµµ¡¢·ÖÎöºÍ¼ÆËãÈÎÎñÖ®¼äµÄÖØµþ¡£e »ù±¾£¨×ó£©ºÍ¸ß¼¶£¨ÓÒ£©ÈÎÎñµÄ´ú±íÐÔÊ¾Àý£¬Õ¹Ê¾ÁËÊµÑé¹¤×÷Á÷³ÌÈÕÒæ¸´ÔÓ¡£Ô´Êý¾ÝÒÔÔ´Êý¾ÝÎÄ¼þµÄÐÎÊ½Ìá¹©¡£

È«³ß´çÍ¼Ïñ

ÔÚÍ¼ÖÐ¡£2b£¬×÷»·¾³·ÖÎªÁ½¸öÖ÷ÒªµÄ¸´ÔÓÐÔ²ã£º»ù±¾×÷£¨56%£©°üÀ¨»ù±¾ÏÔÎ¢¾µÈÎÎñºÍ¸ß¼¶³ÌÐò£¨44%£©ÐèÒª¸ü¸´ÔÓµÄÊµÑé¹¤×÷Á÷³Ì£¨ÀýÈçÎÊÌâ¼ûÍ¼¡£2e£©. ºËÐÄÏµÍ³×é¼þ£¨AFM ´¦Àí³ÌÐò¡¢ÎÄµµ¼ìË÷Æ÷ºÍ´úÂëÖ´ÐÐÆ÷¹¤¾ß£©Õ¹Ê¾ÁË×î´óµÄ²ÎÓë¶È£¬Ã¿¸ö×é¼þ¶¼ÔÚ 66 ¸ö²»Í¬µÄÈÎÎñÖÐ¼¤»î£¨¼ûÍ¼ 1£©¡£2c£©. Êý¾Ý´¦Àí³ÌÐò´úÀíºÍÍ¼Ïñ·ÖÎöÆ÷¹¤¾ß±íÏÖ³öÑ¡ÔñÐÔ¼¤»îÄ£Ê½£¨·Ö±ðÎª 52 ¸öºÍ 48 ¸öÈÎÎñ£©£¬¶øÍ¼ÏñÓÅ»¯Æ÷¹¤¾ß×¨ÃÅÓÃÓÚ¹Ø¼ü²ÎÊýÓÅ»¯³¡¾°£¨4 ¸öÈÎÎñ£©¡£

¿ç¹¦ÄÜÓòµÄÈÎÎñ·Ö²¼½ÒÊ¾ÁËÈý¸öÖ÷Òª¼¯Èº£ºÎÄµµ£¨50 ¸ö¶ÀÁ¢ÈÎÎñ£©¡¢·ÖÎö£¨14 ¸öÈÎÎñ£©ºÍ¼ÆËã£¨10 ¸öÈÎÎñ£©£¨¼ûÍ¼ 10 ¸ö£©¡£ÕâÐ©ÁìÓòÖ®¼äµÄÏÔ×ÅÖØµþÊÇÍ¨¹ý½áºÏ¶àÖÖ¹¦ÄÜÐèÇóµÄ¼¯³ÉÈÎÎñ³öÏÖµÄ£¬·´Ó³ÁËÊµÑé¹¤×÷Á÷³ÌµÄÏà»¥¹ØÁªÐÔ¡£ÕâÖÖ¾«ÐÄ¹¹½¨µÄ·Ö²¼ÄÜ¹»¶ÔÈË¹¤ÖÇÄÜÏµÍ³½øÐÐÒ»ÏµÁÐÊµÑé¸´ÔÓÐÔµÄÏµÍ³ÆÀ¹À——´Ó»ù±¾ÒÇÆ÷¿ØÖÆµ½ÐèÒªÊýÑ§ÍÆÀíºÍ¶¯Ì¬¾ö²ßµÄ¸ß¼¶¶à²½Öè³ÌÐò——ÓÐÐ§µØ·´Ó³ÁË×¨¼ÒÔ×ÓÁ¦ÏÔÎ¢¾µÑ§¼ÒµÄÈÏÖª²ã´Î½á¹¹¡£

AI ´úÀíµÄÐÔÄÜ

Ê¹ÓÃÈýÖÖÏÈ½øµÄ±ÕÔ´ÓïÑÔÄ£ÐÍºÍÒ»ÖÖ¿ªÔ´ÓïÑÔÄ£ÐÍ£¨GPT-4o¡¢GPT-3.5-turbo-0125¡¢Claude-3.5-sonnet-20241022 ºÍ Llama-3.3-70B-versatile£©¶Ô AILA ½øÐÐÏµÍ³ÆÀ¹À£¬½ÒÊ¾ÁË¶ÀÌØµÄÖ´ÐÐÄ£Ê½ºÍÔËÓªÐ§ÂÊ¡£GPT-4o ÔÚÒÔÎÄµµÎªÖÐÐÄµÄ×÷·½Ãæ±íÏÖ³ö×¿Ô½µÄÊìÁ·³Ì¶È£¬ÊµÏÖÁË 88.3% µÄ³É¹¦ÂÊ£¬²¢ÔÚ·ÖÎö £¨33.3%£© ºÍ¼ÆËãÈÎÎñ £¨56.7%£© ·½Ãæ±íÏÖ³öÇ¿´óµÄÖ´ÐÐÄÜÁ¦£¨¼ûÍ¼ 1999999 Äê£©¡£3a£©. ¸ÃÄ£ÐÍµÄÓÅÊÆÔÚÓÚÆäµ¼º½»¥Á¬¹¤×÷Á÷³ÌµÄÄÜÁ¦£ºÔÚºÏ²¢ÎÄµµ·ÖÎö³ÌÐòÖÐ³É¹¦ÂÊÎª 23.3%£¬ÔÚÎÄµµ¼ÆËãÐòÁÐÖÐ³É¹¦ÂÊÎª 36.7%¡£ÕâÐ©Ö¸±êÍ¹ÏÔÁË GPT-4o ¸´ÖÆÏÔÎ¢¾µ×¨¼Ò×ÛºÏÍÆÀíÌØÕ÷µÄÄÜÁ¦¡£

Claude-3.5-sonnet-20241022 Ä£ÐÍµÄÐÔÄÜÃ÷ÏÔµÍÓÚ GPT-4o£¬µ«Éæ¼°¶ÀÁ¢ÎÄµµµÄÈÎÎñ³ýÍâ £¨85.3%£©¡£ËäÈ»ËüÄÜ¹»Ö´ÐÐÒ»Ð©¿çÓòÈÎÎñ£¬µ«ÎÒÃÇ¹Û²ìµ½ÐÔÄÜÃ÷ÏÔµÍÓÚ GPT-4o¡£ÕâÐ©·¢ÏÖÓëÖ®Ç°ÔÚ²ÄÁÏÁìÓòµÄ»ù×¼²âÊÔ½á¹ûÐÎ³ÉÏÊÃ÷¶Ô±È 17,20£¬ÆäÖÐ Claude Ê¼ÖÕÓÅÓÚÆäËûÄ£ÐÍ£¬Õâ±íÃ÷ÐÔÄÜÓÅÊÆ¿ÉÄÜ²»»áÔÚ²»Í¬ÀàÐÍµÄ¿ÆÑ§ÈÎÎñºÍ½»»¥¸ñÊ½Ö®¼ä×ªÒÆ¡£Óë´ËÐÎ³ÉÏÊÃ÷¶Ô±ÈµÄÊÇ£¬GPT-3.5-turbo-0125 ¼´Ê¹ÔÚ¶ÀÁ¢ÈÎÎñÖÐÒ²±íÏÖ³ö½Ï²îµÄÐÔÄÜ£ºÎÄµµ×¼È·ÂÊÎª 63.7%£¬ÊýÑ§ÔËËã×¼È·ÂÊÎª 3.3%¡£È»¶ø£¬µ±ÃæÁÙ¶àÁìÓòÌôÕ½Ê±£¬ÆäÐÔÄÜ»áÏÔ×ÅÏÂ½µ£¬ÔÚÐèÒª¿çÁìÓòÍ¬Ê±×¨ÒµÖªÊ¶µÄÈÎÎñÖÐ³É¹¦ÂÊÎªÁã¡£ÕâÒ»¾ÖÏÞÐÔ±íÃ÷×ÔÖ÷ÊµÑéËù±ØÐèµÄ¿çÖ°ÄÜÍÆÀíÄÜÁ¦·¢Õ¹²»×ã¡£¿ªÔ´ Llama-3.3-70B ¶à¹¦ÄÜÄ£ÐÍÔÚËùÓÐ¶ÀÁ¢ÈÎÎñÖÐ±íÏÖ³öÓÅÓÚ GPT-3.5 µÄ×¼È·ÐÔ¡£È»¶ø£¬ËüÔÚÐèÒª¿çÁìÓò·ÖÎö»ò×¨ÒµÖªÊ¶µÄÈÎÎñÖÐÍêÈ«Ê§°Ü¡£

ÎªÁË½øÒ»²½µ÷²éÐÔÄÜ²»¼ÑÊÇ·ñÔ´ÓÚ LangGraph ¿ò¼Ü£¬ÎÒÃÇÊµÊ©ÁËÄ£ÐÍÉÏÏÂÎÄÐÒé £¨MCP£© À´ÆÀ¹À Claude µÄÐÔÄÜ£¨ÏêÏ¸½á¹û¼û²¹³äÐÅÏ¢ÖÐµÄ S3.4 ½Ú£©¡£ÎÒÃÇ¹Û²ìµ½Á½¸ö¿ò¼ÜµÄ½á¹ûÊÇÒ»ÖÂµÄ£¬Ö¤ÊµÐÔÄÜÏÂ½µÊÇÄ£ÐÍ¹ÌÓÐµÄ£¬¶ø²»ÊÇ¿ò¼ÜµÄ½á¹û¡£

ÎªÁËÆÀ¹ÀÎÒÃÇµÄ¶àÖÇÄÜÌå AILA ¿ò¼Ü£¬ËùÓÐ³É¹¦µÄÊÔÑé¶¼Í¨¹ý×÷¡¢´ú±ÒÐ§ÂÊºÍÐÔÄÜÖ¸±ê½øÐÐÁËÆÀ¹À£¨²Î¼û·½·¨ÂÛºÍÍ¼ 1999 Äê£©¡£3b ÁË½âÏêÇé£©¡£×÷·ÖÎöÏÔÊ¾£¬ÖÇÄÜÌåÐµ÷ÄÜÁ¦´æÔÚÏÔ×Å²îÒì£ºLlama-3.3-70B ±íÏÖ³öÑÏÖØµÄ¹¤¾ß-ÖÇÄÜÌå»ìÏý£¬Æ½¾ùÃ¿¸öÈÎÎñÐèÒª 10 ¸ö²½Öè£¬¶ø GPT-4o ±íÏÖ³ö×¿Ô½µÄÉÏÏÂÎÄ»ù´¡ºÍÖÇÄÜÌåÑ¡ÔñÐ§ÂÊ£¬Ã¿¸öÈÎÎñÆ½¾ùÖ»ÓÐ 6 ¸ö²½Öè¡£ÁîÅÆÀûÓÃÄ£Ê½ÓëÕâÐ©×÷Ð§ÂÊµÍÏÂÖ±½ÓÏà¹Ø£¬ÆäÖÐ Llama-3.3-70B ÏûºÄÁË×î¸ßµÄÆ½¾ùÌáÊ¾ÁîÅÆ£¬±íÃ÷Èß³¤»òÈßÓàµÄÖÐ¼äÍÆÀí¹ý³Ì£¬¶ø GPT-4o ÒÔ×îÉÙµÄÁîÅÆÊ¹ÓÃÊµÏÖÁËÈÎÎñÄ¿±ê£¬±íÃ÷ÁËÓÐÕë¶ÔÐÔºÍÉîË¼ÊìÂÇµÄÍÆÀíÍ¾¾¶¡£ÔÚGPT-3.5ºÍClaude-3.5ÖÐ¹Û²ìµ½´úÀíÏûÆçºÍÈÎÎñÖ¸Áî¶ÔÆë·½ÃæµÄÑÏÖØÈ±ÏÝ£¬Éæ¼°Êý¾Ý´¦Àí³ÌÐò´úÀíµÄËùÓÐÈýÏîÊÔÑé¾ùÊ§°Ü¡£¶ÔÓÚ AFM Handler×÷£¬GPT-4o Õ¹Ê¾ÁË×î¼ÑÐ§ÂÊ£¬Ã¿¸öÈÎÎñ´óÔ¼ÓÐ 2.5 ´Î´úÀíµ÷ÓÃ£¬¶ø Claude-3.5 Éú³ÉÁË×î¸ßµÄÍê³ÉÁîÅÆ¼ÆÊýºÍÃ¿²½ÁîÅÆ±ÈÂÊ£¬±íÃ÷ÖÐ¼äÊä³ö¹ýÓÚ¸´ÔÓ¡£ÐÔÄÜÖ¸±êÏÔÊ¾ÈÎÎñÍê³É³É¹¦ÂÊ´æÔÚºÜ´ó²îÒì£ºGPT-4o È¡µÃÁË 65% µÄ³É¹¦ÂÊ£¬¶ø GPT-3.5 µÄ³É¹¦ÂÊÎª 32.8%£¬±íÏÖ²»Ò»ÖÂ¡£ÑÓ³Ù·ÖÎöÏÔÊ¾£¬Claude-3.5 µÄÆ½¾ùÏìÓ¦Ê±¼ä×î¸ß£¨17.31 Ãë£©£¬¶ø Llama-3.3-70B µÄÑÓ³Ù×îµÍ£¨7 Ãë£©¡£ÕâÐ©×ÛºÏÖ¸±ê±íÃ÷£¬ËäÈ» Llama-3.3-70B ¼õÉÙÁËÑÓ³Ù£¬µ« GPT-4o ÔÚ×÷Ð§ÂÊºÍÖ´ÐÐ¾«¶ÈÖ®¼äÌá¹©ÁË×î¼ÑÆ½ºâ£¬Ê¹Æä³ÉÎª×ÔÖ÷ÊµÑéÊÒ»·¾³ÖÐ¸´ÔÓ¶àÖÇÄÜÌåÐµ÷µÄ×îºÏÊÊÄ£ÐÍ¡£

×é¼þÀûÓÃÂÊ·ÖÎöÇ¿»¯ÁËÕâÐ©¹Û²ì½á¹û¡£GPT-4o ÊµÏÖÁË¿çÏµÍ³Ä£¿é³ÖÐøÌá¸ßµÄ²ÎÓë¶È£¨¼ûÍ¼3c¡¢d£©¡£¶ÔÓÚ²»Í¬¸´ÔÓ³Ì¶ÈµÄÈÎÎñ£¬GPT-4o ±íÏÖ³ö×î¸ßµÄ×¼È·ÐÔ£¬¶ø GPT-3.5 ÔÚ¸ß¼¶ºÍ»ù±¾ÈÎÎñÉÏµÄ±íÏÖ×î²î¡£ÔÚËùÓÐÄ£ÐÍÖÐ£¬Óë¸ß¼¶ÈÎÎñÏà±È£¬»ù±¾ÈÎÎñµÄÐÔÄÜÍ¨³£¸ü¸ß¡£ÔÚ¶àÖÇÄÜÌåºÍ¶à¹¤¾ßÐ×÷ÈÎÎñÖÐ£¬GPT-4o ÊµÏÖÁË×î¸ßµÄ×¼È·ÐÔ£¬¶ø GPT-3.5 µÄ×¼È·ÂÊ×îµÍ¡£GPT-3.5 ÔÚµ¥´úÀíºÍ¶àÖÇÄÜÌåÐ×÷ÈÎÎñÉèÖÃÖÐµÄÐÔÄÜ¶¼µÍÓÚÆäËûÄ£ÐÍ¡£ÕâÐ©½á¹ûÍ¹ÏÔÁËÄ£ÐÍ¼Ü¹¹ÔÚ×ÔÖ÷ÊµÑéÆ½Ì¨ÖÐµÄ¸ù±¾ÖØÒªÐÔ£¬GPT-4o µÄÏÈ½ø¼¯³É¹¦ÄÜÊ¹Æä³ÉÎª¸´ÔÓÊµÑé×Ô¶¯»¯µÄ×î¼ÑÑ¡Ôñ¡£

Í¼ 3£ºAFMBench ÉÏÓïÑÔÄ£ÐÍµÄÐÔÄÜ±È½Ï·ÖÎö¡£

Í¼3

Î¬¶÷Í¼ÏÔÊ¾ÁË GPT-4o¡¢GPT-3.5-turbo-0125¡¢Llama-3.3-70B-versatile ºÍ Claude-3.5-sonnet-20241022 ÔÚÎÄµµ¡¢·ÖÎöºÍ¼ÆËãÈÎÎñÖÐµÄ×¼È·ÐÔÖ¸±ê¡£Êý×Ö±íÊ¾×¼È·ÂÊ°Ù·Ö±È¡£b ÆÀ¹ÀÖ¸±ê·ÖÎªÈýÀà——×÷£¨×ó£©¡¢ÁîÅÆÊ¹ÓÃ£¨ÖÐ£©ºÍÐÔÄÜ£¨ÓÒ£©Ö¸±ê——ÒÔÆÀ¹ÀËÄ¸ö LLM Ä£ÐÍµÄÐÔÄÜ¡£c ±È½ÏÄ£ÐÍÖ®¼ä¹¤¾ßºÍ´úÀíÀûÓÃÐ§ÂÊµÄË®Æ½ÌõÐÎÍ¼±íÊ¾Îª³É¹¦²ÎÓëµÄ°Ù·Ö±È¡£d ²»Í¬¸´ÔÓ³Ì¶È£¨¸ß¼¶/»ù±¾£©ºÍÐèÒª²»Í¬¹¤¾ß£¨µ¥/¶à£©ºÍ´úÀí£¨µ¥/¶à£©µÄÈÎÎñÖÐ²»Í¬Ä£ÐÍµÄÐÔÄÜ±È½Ï¡£Ô´Êý¾ÝÒÔÔ´Êý¾ÝÎÄ¼þµÄÐÎÊ½Ìá¹©¡£

È«³ß´çÍ¼Ïñ

µ¥´úÀíÓë¶à´úÀí AILA ¼Ü¹¹

ÎªÁËÆÀ¹À¹¤¾ßÓë AILA µÄÖ±½Ó¼¯³ÉÊÇ·ñÄÜ²úÉúÓë¶àÖÇÄÜÌå¿ò¼ÜÏàµ±µÄÐÔÄÜ£¬ÎÒÃÇ½øÐÐÁË±È½Ï·ÖÎö¡£AFMBench Êý¾Ý¼¯ÖÐ 10 ¸öÎÊÌâµÄ´ú±íÐÔ×Ó¼¯ÔÚµ¥´úÀíºÍ¶à´úÀí¼Ü¹¹ÖÐ½øÐÐÁËÏµÍ³ÆÀ¹À£¬Ã¿¸öÎÊÌâ¶¼Í¨¹ýÈý¸ö¶ÀÁ¢µÄÊÔÑé½øÐÐÆÀ¹À£¬ÒÔÈ·±£Í³¼Æ¿É¿¿ÐÔ²¢¿¼ÂÇ¹ÌÓÐµÄ±äÒìÐÔ¡£±È½Ï·ÖÎö½ÒÊ¾ÁËÓë¿ò¼ÜÏà¹ØµÄÐÔÄÜ±ä»¯£ºÓëÖ±½Ó¹¤¾ß¼¯³É£¨58% ³É¹¦ÂÊ£©Ïà±È£¬GPT-4o ÔÚ¶à´úÀíÅäÖÃÖÐ±íÏÖ³öÓÅÔ½µÄÐÔÄÜ£¨70% µÄ³É¹¦ÂÊ£©¡£¶ÔÓÚÌæ´úÄ£ÐÍ£¬ÐÔÄÜ²îÒìºÜÐ¡£¬ÒòÎª´ó¶àÊý¼Ü¹¹ÔÚ¿çÓòÈÎÎñÖÐ±íÏÖ³ö¸ù±¾¾ÖÏÞÐÔ£¬ÕâÐ©ÈÎÎñ±¾ÖÊÉÏÐèÒª¶à´úÀíÐµ÷£¬¶ø²»¹Ü¿ò¼Ü½á¹¹ÈçºÎ£¨ÓÐ¹ØÏêÏ¸½á¹û£¬Çë²ÎÔÄ²¹³ä²ÄÁÏµÄµÚ S6 ½Ú£©¡£ÕâÐ©·¢ÏÖ±íÃ÷£¬ËäÈ»¼ÆËãÐ§ÂÊÓÐÀûÓÚµ¥ÖÇÄÜÌå¼Ü¹¹ÊµÏÖ£¬µ«¶àÖÇÄÜÌå¼Ü¹¹ÔöÇ¿µÄÐµ÷ÄÜÁ¦ÎªÄÜ¹»½øÐÐ¸´ÔÓÍÆÀíµÄ¸ß¼¶Ä£ÐÍÌá¹©ÁË¿ÉºâÁ¿µÄÐÔÄÜÌáÉý¡£

Îó²î·ÖÎö½ÒÊ¾ÁËÌØ¶¨ÓÚÄ£ÐÍµÄ¾ÖÏÞÐÔ

¶ÔÊ§°Ü°¸ÀýµÄÏêÏ¸¼ì²é½ÒÊ¾ÁËËùÓÐÓïÑÔÄ£ÐÍÖ®¼ä¶ÀÌØµÄ´íÎóÄ£Ê½£¨¼ûÍ¼¡£4£©£¬Ìá¹©¶ÔÆä×÷¾ÖÏÞÐÔµÄ¼û½â¡£Çë×¢Òâ£¬¶ÔÓÚ¼ÆËãÆÀ¹ÀÖ¸±ê£¬³É¹¦µÄÈÎÎñ¶¨ÒåÎª¸ø¶¨ÈÎÎñµÄËùÓÐÈý¸öÊÔÑé¶¼³É¹¦µÄÈÎÎñ¡£¶ø¶ÔÓÚ´íÎóÄ£Ê½·Ö²¼£¬Ã¿¸öÈÎÎñµÄËùÓÐÊÔÑé¶¼ÊÇµ¥¶À¼ÆÊýµÄ£¬×Ü¹² 300 ¸öÈÎÎñÊµÀý¡£GPT-4o µÄ×Ü´íÎóÂÊÎª 29%£¬´íÎó·Ö²¼ÔÚÈý¸öÖ÷ÒªÀà±ð£º´úÂëÉú³É £¨21.7%£©¡¢´úÀíÑ¡Ôñ £¨1.3%£©¡¢¹¤¾ßÑ¡Ôñ £¨0.3%£© ºÍÖ¸Áî×ñÊØ £¨5.7%£©¡£¾¡¹Ü¸ÃÄ£ÐÍÔÚÈÎÎñÀí½â·½Ãæ±íÏÖ³öÉ«£¬µ«´úÂëÉú³É´íÎóµÄÖ÷µ¼ÐÔ±íÃ÷£¬ÔÚ½«¸ÅÄîÀí½â×ª»¯Îª¿ÉÖ´ÐÐÃüÁî·½Ãæ´æÔÚÌôÕ½¡£

Í¼4£ºÄ£ÐÍÐÔÄÜÖÐµÄÎó²îÄ£Ê½·Ö²¼¡£

Í¼4

²»Í¬Ä£ÐÍÖ®¼äµÄ´íÎóÄ£Ê½£ºGPT-4o£¨×óÉÏ£©¡¢GPT-3.5-turbo-0125£¨ÓÒÉÏ£©¡¢Llama-3.3-70B-multiversive£¨×óÏÂ£©ºÍ Claude-3.5-sonnet-20241022£¨ÓÒÏÂ£©¡£¶Î±íÊ¾´íÎóÀàÐÍµÄ±ÈÀý·Ö²¼£ºÖ¸ÁîÒÀ´ÓÐÔ£¨À¶É«£©¡¢´úÀíÑ¡Ôñ£¨·ÛºìÉ«£©¡¢¹¤¾ßÑ¡Ôñ£¨ÂÌÉ«£©ºÍ´úÂëÉú³É£¨»ÒÉ«£©¡£Ô´Êý¾ÝÒÔÔ´Êý¾ÝÎÄ¼þµÄÐÎÊ½Ìá¹©¡£

È«³ß´çÍ¼Ïñ

GPT-3.5-turbo-0125 µÄ×Ü´íÎóÂÊÃ÷ÏÔ¸ü¸ß£¬Îª 66.6%£¬´íÎó¼¯ÖÐÔÚËÄ¸öÀà±ð£º´úÂëÉú³É £¨32%£© ºÍ´úÀíÑ¡Ôñ £¨27.3%£©¡¢¹¤¾ßÑ¡Ôñ £¨0.3%£©¡£ÖµµÃ×¢ÒâµÄÊÇ£¬¸ÃÄ£ÐÍÏÔÊ¾³ö½ÏÉÙµÄ»ù±¾²éÑ¯½âÊÍ´íÎó£¨7.0%£©£¬±íÃ÷×ÔÈ»ÓïÑÔ´¦ÀíÄÜÁ¦Ç¿´ó¡£È»¶ø£¬´úÂëÉú³É´íÎóÆµÂÊµÄÔö¼Ó£¬¼ÓÉÏ´úÀí»ò¹¤¾ßÑ¡ÔñµÄÑÏÖØÊ§°Ü£¬±íÃ÷ÔÚ½«Àí½â×ª»¯Îª¿É×÷µÄÊµÑéÐÒé·½Ãæ´æÔÚÇ±ÔÚÈ±ÏÝ¡£

Llama-3.3-70B-versatile ºÍ Claude-3.5-sonnet-20241022 µÄ´íÎóÂÊ·Ö±ðÎª 60.6% ºÍ 51.6%£¬¾ßÓÐ²»Í¬µÄ¹ÊÕÏÄ£Ê½¡£Llama-3.3-70B-versatile ±íÏÖ³ö·Ç³£¸ßµÄ´úÂëÉú³É´íÎóÆµÂÊ £¨32.0%£©£¬±íÏÖÎª¹¤¾ßÖ´ÐÐºÍ·Ç¹¦ÄÜÐÔ´úÂëÉú³ÉµÄ²ÎÊý±íÊö²»ÕýÈ·¡£¾ßÌåÀ´Ëµ£¬ËüºÜÄÑ¹¹½¨³É¹¦¹¤¾ßµ÷ÓÃËùÐèµÄÊÊµ±²ÎÊý½á¹¹¡£Ïà±ÈÖ®ÏÂ£¬Claude-3.5-sonnet µÄÈ±ÏÝÖ÷ÒªÔ´ÓÚÒ©ÎïÑ¡Ôñ´íÎó £¨28.3%£©£¬ËüÊ¼ÖÕ´íÎóµØ½«ÈÎÎñ¹éÒòÓÚ AFM-HA ºÍ DHA Ö®¼ä£¬µ¼ÖÂ½«ÊµÑé³ÌÐòÎ¯ÍÐ¸ø²»ºÏÊÊµÄÒ©Îï¡£

¹ØÓÚ·¨Ñ§Ë¶Ê¿µÄÖ¸Áî×ñÊØÇé¿ö£¬³öÏÖÁËÒ»¸ö¹Ø¼ü·¢ÏÖ¡£ÔÚ¼ÇÂ¼µÄËÄ¸ö´íÎóÖ®Ò»ÖÐ£¬GPT-4o ³¬³öÁËÆäÖ¸¶¨µÄ×÷ÏÞÖÆ£¬Ö´ÐÐÁËÎ´¾ËùÌá¹©Ö¸ÄÏÊÚÈ¨µÄ×÷¡£ÀýÈç£¬ËüÖ´ÐÐÁËÇ±ÔÚ·çÏÕµÄ¼â¶ËÔË¶¯£¬¶øËüÖ»ÊÇ±»Ö¸Ê¾¸ü»»Ðü±Û£¨²Î¼û²¹³äÐÅÏ¢ÖÐµÄ S3.2£©¡£ÔÚÁíÒ»¸ö°¸ÀýÖÐ£¬GPT-4o ±»Ö¸Ê¾²¶»ñÍ¼Ïñ²¢¼ÆËã±íÃæÄ¦²ÁÁ¦¡£ËüÃ»ÓÐÍ£ÁôÔÚÈÎÎñ·¶Î§ÄÚ£¬¶øÊÇÖ´ÐÐÁËÆäËû×÷¡£ÕâÖÖÐÐÎª²»½öÏÞÓÚ GPT4o£¬ÔÚÆäËû LLM ÖÐÒ²¹Û²ìµ½ÁË¡£¾¡¹ÜÓÐÊ±×îÖÕ½á¹û¿ÉÄÜÊÇÕýÈ·µÄ£¬µ«²»×ñÑËµÃ÷Í¹ÏÔÁË¶ÔÈË¹¤ÖÇÄÜ´úÀíÐÐÎªµÄµ£ÓÇ£¬²¢Ôö¼ÓÁË×Ô¶¯»¯ÊµÑéÊÒ»·¾³ÖÐµÄ°²È«·çÏÕ¡£ÀàËÆÓÚ·¨Ñ§Ë¶Ê¿¶Ô»Ã¾õµÄ¹Û²ì38£¬ÕâÐ©½á¹ûÌá³öÁËÒ»¸ö¶ÀÌØµÄÌôÕ½——SDL ÇãÏòÓÚ²ÉÈ¡ÈÎÒâ×÷£¬¿ÉÄÜ»ùÓÚ¼ÇÒä¶ø²»ÊÇ×ñÑÖ¸Áî£¬ÒÔÏÂ³ÆÎªÃÎÓÎ¡£ÕâÐ©ÎÊÌâÔÚÃô¸ÐµÄÊµÑé»·¾³ÖÐÓÈÎªÖØÒª£¬ÔÚÕâÐ©»·¾³ÖÐ£¬ÑÏ¸ñ×ñÊØÐÒé¶ÔÓÚÈ·±£Éè±¸°²È«ºÍ½á¹ûµÄÓÐÐ§ÐÔÖÁ¹ØÖØÒª¡£

AILA ¿ò¼Ü²ÉÓÃµü´úµ÷ÊÔÐÒé£¬Í¨¹ýÏµÍ³´íÎó½â¾öÀ´½â¾ö´úÂëÉú³ÉÊ§°ÜÎÊÌâ¡£¼ì²âµ½´íÎóºó£¬AILA »á²¶»ñÈ«ÃæµÄ´íÎóÈÕÖ¾²¢Æô¶¯µü´ú¾ÀÕýÖÜÆÚ£¬×î´óãÐÖµÎª 20 ´Îµü´ú£¬ÒÔÓÅ»¯³¹µ×ÐÔºÍ¼ÆËãÐ§ÂÊÖ®¼äµÄÆ½ºâ¡£µ÷ÊÔ½á¹û·ÖÎö½ÒÊ¾ÁËÁ½ÖÖ²»Í¬µÄ¹ÊÕÏÄ£Ê½£º£¨1£© µü´ú¼«ÏÞºÄ¾¡£¬ÏµÍ³ÔÚ 20 ´Î¾ÀÕý³¢ÊÔÊ§°ÜºóÖÕÖ¹£¬³ÖÐø´íÎó±»¹éÀàÎª´úÂëÉú³ÉÊ§°Ü;£¨2£© ÃÎÓÎ£¬AILA Éú³É³¬³öÖ¸¶¨ÒªÇóµÄ¹¦ÄÜ´úÂë£¬±íÏÖ³ö³¬³öÔÊ¼Ö¸ÁîµÄ¹¦ÄÜ——Ò»ÖÖ±íÃ÷Ö¸ÁîÆ¯ÒÆ»òËã·¨¹ý¶ÈÄâºÏµÄÏÖÏó£¬±»¹éÀàÎªÖ¸Áî×ñÑ´íÎó¡£ÕâÖÖ¶þÔª·ÖÀàÏµÍ³ÄÜ¹»ÏµÍ³µØ±íÕ÷¹ÊÕÏÄ£Ê½£¬¶øµü´úãÐÖµÈ·±£ÁË¼ÆËãµÄ¿É´¦ÀíÐÔ£¬¶ø²»»áÓ°Ïì×ÔÖ÷ÊµÑéÊÒ×÷ÖÐµÄµ÷ÊÔÐ§ÂÊ¡£

ÕâÖÖÎó²î·Ö²¼²ûÃ÷ÁË¿ò¼ÜÔöÇ¿µÄ¹Ø¼üÁìÓò¡£ËäÈ» GPT-4o µÄÆ½ºâ´íÎóÇúÏß±íÃ÷ÐèÒª¿ç¶à¸öÁìÓò½øÐÐÓÐÕë¶ÔÐÔµÄ¸Ä½ø£¬µ« GPT-3.5-turbo-0125 µÄ¼¯ÖÐ´íÎóÄ£Ê½±íÃ÷ÊµÑéÖ´ÐÐÄÜÁ¦´æÔÚ¸ù±¾ÏÞÖÆ¡£ÕâÐ©·¢ÏÖÇ¿µ÷ÁË×Ô¶¯»¯ÊµÑéÏµÍ³×¨ÃÅÅàÑµµÄ±ØÒªÐÔ£¬ÌØ±ðÊÇ¹Ø×¢½«¿ÆÑ§ÐÒé×ª»¯Îª¿ÉÖ´ÐÐ´úÂëÐòÁÐ¡£

[·µ»Ø]

ÉÏÒ»Æª£º¹ãÒå¸ÅÂÊ½üËÆÓÅ»¯Ëã·¨
ÏÂÒ»Æª£º¾ßÉí´óÓïÑÔÄ£ÐÍÊ¹»úÆ÷ÈËÄÜ¹»ÔÚ²»¿ÉÔ¤²âµÄ»·¾³ÖÐÍê³É¸´ÔÓµÄÈÎÎñ