Éî¶ÈÉñ¾ÍøÂç¾ßÓÐÄÚÖÃµÄ°Â¿¨Ä·Ìêµ¶ - »úÐµÂÛÎÄ - Ò»ÆðÓ®ÂÛÎÄ¸¨µ¼Íø--×¨Òµ´úÐ´´ú·¢SCI¡¢EI¡¢ºËÐÄÆÚ¿¯¡¢´úÐ´MBA¡¢Ë¶²©±ÏÒµÂÛÎÄ¡£QQ910330594

»¶Ó·ÃÎÊÒ»ÆðÓ®ÂÛÎÄ¸¨µ¼Íø

¼ÓÈëÊÕ²Ø | ÉèÎªÖ÷Ò³ | ÁªÏµÎÒÃÇ

±¾Õ¾¶¯Ì¬

¸ü¶à

ÁªÏµÎÒÃÇ

¸ü¶à

QQ£º3949358033

Î¢ÐÅ£ºpaperwinner

¹¤×÷Ê±¼ä£º9:00-24:00

³É¹¦°¸Àý

¸ü¶à

»úÐµÂÛÎÄ

µ±Ç°Î»ÖÃ£ºÊ×Ò³ > »úÐµÂÛÎÄ

Éî¶ÈÉñ¾ÍøÂç¾ßÓÐÄÚÖÃµÄ°Â¿¨Ä·Ìêµ¶

À´Ô´£ºÒ»ÆðÓ®ÂÛÎÄÍø ÈÕÆÚ£º2025-01-22 ä¯ÀÀÊý£º293 ¡¾ ×ÖÌå£º ´ó ÖÐ Ð¡ ¡¿

¹ý¶È²ÎÊý»¯Éî¶ÈÉñ¾ÍøÂç £¨DNN£© µÄ×¿Ô½ÐÔÄÜ±ØÐëÔ´ÓÚÍøÂç¼Ü¹¹¡¢ÑµÁ·Ëã·¨ºÍÊý¾Ý½á¹¹Ö®¼äµÄÏà»¥×÷ÓÃ¡£ÎªÁË½â¿ª¼à¶½Ñ§Ï°µÄÕâÈý¸ö×é³É²¿·Ö£¬ÎÒÃÇ¸ù¾Ý DNN ±íÊ¾µÄº¯ÊýÓ¦ÓÃ±´Ò¶Ë¹Í¼Æ¬¡£ÏÈÑéº¯ÊýÓÉÍøÂç¼Ü¹¹¾ö¶¨£¬ÎÒÃÇÍ¨¹ýÀûÓÃÓÐÐòºÍ»ìãç»úÖÆÖ®¼äµÄ¹ý¶ÉÀ´¸Ä±äËü¡£¶ÔÓÚ²¼¶ûº¯Êý·ÖÀà£¬ÎÒÃÇÊ¹ÓÃº¯Êý¶ÔÊý¾ÝµÄÎó²îÆ×À´½üËÆËÆÈ»¡£½«ÆäÓëÏÈÑé½á¹ûÏà½áºÏ£¬¿ÉÒÔµÃ³ö¶ÔºóÑéµÄ×¼È·Ô¤²â£¬¸ÃÔ¤²âÕë¶ÔÊ¹ÓÃËæ»úÌÝ¶ÈÏÂ½µÑµÁ·µÄ DNN ½øÐÐ²âÁ¿¡£¸Ã·ÖÎö±íÃ÷£¬½á¹¹»¯Êý¾ÝÒÔ¼°¶Ô £¨Kolmogorov£© ¼òµ¥º¯ÊýµÄÌØ¶¨°Â¿¨Ä·Ìêµ¶×´¹éÄÉÆ«²î£¬Ç¡ºÃµÖÏûÁË¾ßÓÐ¸´ÔÓÐÔµÄº¯ÊýÊýÁ¿µÄÖ¸ÊýÔö³¤£¬ÊÇ DNN ³É¹¦µÄ¹Ø¼ü¡£

ÆäËûÈËÕýÔÚ²é¿´ÀàËÆÄÚÈÝ

¸ßÐ§µÄÇ³²ãÑ§Ï°×÷ÎªÉî¶ÈÑ§Ï°µÄÌæ´ú·½°¸

ÎÄÕÂ ¿ª·Å»ñÈ¡ 20 ËÄÔÂ 2023

½«ÈË¹¤Éñ¾ÍøÂçÖÐ·Ö²ã½á¹¹µÄ¶ÈÁ¿ÓëÆäÐÔÄÜÏà¹ØÁª

ÎÄÕÂ ¿ª·Å»ñÈ¡ 01 Ê®ÔÂ 2024

·Ö¶ÎÏßÐÔÉñ¾ÍøÂçºÍÉî¶ÈÑ§Ï°

±¨µÀ 2022-6-09

½éÉÜ

¾¡¹ÜÉî¶ÈÉñ¾ÍøÂç £¨DNN£© ÒÑ¾³¹µ×¸Ä±äÁËÏÖ´ú»úÆ÷Ñ§Ï°1,2£¬¹ØÓÚËüÃÇÎªÊ²Ã´±íÏÖÈç´Ë³öÉ«µÄ»ù±¾ÀíÂÛÀí½âÈÔÈ»ÄÑÒÔ×½Ãþ3,4.ËüÃÇ×îÁîÈË¾ªÑÈµÄÌØµãÖ®Ò»ÊÇËüÃÇÔÚ¹ý¶È²ÎÊý»¯µÄÇé¿öÏÂÐ§¹û×îºÃ£¬²ÎÊý±ÈÊý¾Ýµã¶àµÃ¶à¡£ÕýÈçÄÇ¾äÖøÃûµÄÇÎÆ¤»°Ëù±í´ïµÄÄÇÑù£º“ÓÃËÄ¸ö²ÎÊýÎÒ¿ÉÒÔ×°ÏÂÒ»Í·´óÏó£¬ÓÃÎå¸ö²ÎÊýÎÒ¿ÉÒÔÈÃËû°Ú¶¯ËûµÄ±Ç×Ó¡£”£¨¶÷Àï¿Æ··ÑÃ× £¨Enrico Fermi£© ¹é¹¦ÓÚÔ¼º²··ë·ÅµÒÁÂü £¨John von Neumann£©5£©£¬ÈËÃÇÆÕ±éÈÏÎª²ÎÊý¹ý¶à»áµ¼ÖÂ¹ý¶ÈÄâºÏ£ºÄ£ÐÍ»á²¶»ñÔëÉù»òÊý¾ÝµÄÆäËûÎÞ¹Ø½ôÒªµÄ·½Ãæ£¬Òò´ËÔ¤²âÐ§¹û²»¼Ñ¡£

ÔÚÍ³¼ÆÑ§Ï°ÀíÂÛÖÐ6ÕâÖÖÖ±¾õÔÚÄ£ÐÍÈÝÁ¿·½Ãæ±»ÐÎÊ½»¯¡£ÖØÒªµÄ²»½ö½öÊÇ²ÎÊýµÄÊýÁ¿£¬¶øÊÇÄ£ÐÍ¿ÉÒÔ±í´ïµÄ¼ÙÉè¼¯µÄ¸´ÔÓÐÔ¡£¶Ô×î¼ÑÐÔÄÜµÄ×·ÇóÍ¨³£ÒÔÆ«²î-·½²îÈ¨ºâÀ´±íÊ¾¡£¹ýÓÚ¼òµ¥µÄÄ£ÐÍ»áÒòÆ«²î¶øÒýÈëÎó²î;ËûÃÇÎÞ·¨²¶»ñÉú³ÉÊý¾ÝµÄµ×²ã½ø³Ì¡£¹ýÓÚ¸´ÔÓµÄÄ£ÐÍ¶ÔÊý¾ÝµÄËæ»ú²¨¶¯·´Ó¦¹ý¶È£¬´Ó¶øµ¼ÖÂÆäÔ¤²â³öÏÖ²îÒì¡£

DNN ÊÇ³öÁËÃûµÄ¸ß±í´ïÁ¦7¡¢8¡¢9£¬¼´ËüÃÇ¾ßÓÐ¼«¸ßµÄÈÝÁ¿¡£Òò´Ë£¬ËûÃÇµÄ·º»¯ÄÜÁ¦ËÆºõ´òÆÆÁËÍ³¼ÆÑ§Ï°ÀíÂÛµÄ»ù±¾¹æÔò¡£ÔÚÃ»ÓÐÃ÷È·ÕýÔò»¯µÄÇé¿öÏÂ£¬DNN ¾¿¾¹ÊÇÈçºÎÊµÏÖÕâÒ»×³¾ÙµÄ£¬ÕâÊÇÒ»¸ö¼¸Ê®ÄêÀ´Ò»Ö±Ðü¶øÎ´¾öµÄ»ù±¾ÎÊÌâ3,4.¾¡¹Ü×î½üÈ¡µÃÁËºÜ¶à½øÕ¹£¨ÓÐ¹ØÎÄÏ×¸ÅÊö£¬Çë²ÎÔÄ²¹³äËµÃ÷ 1£©£¬µ«¶ÔÓÚÎªÊ²Ã´ DNN ÔÚ¹ý¶È²ÎÊý»¯×´Ì¬ÏÂ¹¤×÷µÃÈç´ËºÃ£¬ÉÐÎ´´ï³É¹²Ê¶¡£

ÔÚÕâÀï£¬ÎÒÃÇÔÚÓÃÓÚ·ÖÀàµÄ¼à¶½Ñ§Ï°µÄ±³¾°ÏÂÑÐ¾¿Õâ¸öÄÑÌâ£¬ÆäÖÐÊäÈë xÎÒ¸½¼Óµ½±êÇ© yÎÒ.¸ø¶¨Ò»¸öÓÉm¸öÊäÈë-Êä³ö¶Ô×é³ÉµÄÑµÁ·¼¯\£¨S={\{\left.\right£¨{x}_{i}£¬{y}_{i}\}}_{i=1}^{m}\£©£¬´ÓÊý¾Ý·Ö²¼\£¨{{{\mathcal{D}}}}\£©ÖÐ²ÉÑù£¬ÈÎÎñÊÇÔÚSÉÏÑµÁ·Ò»¸öÄ£ÐÍ£¬Ê¹ÆäÔÚÔ¤²âÎ´¼û¹ýÊäÈëµÄ²âÊÔ¼¯TµÄÊä³ö±êÇ©\£¨{\hat{y}}_{i}\£©Ê±±íÏÖÁ¼ºÃ£¨¾ßÓÐµÍ·º»¯Îó²î£©£¬ ´Ó \£¨{{{\mathcal{D}}}}\£© ÖÐ²ÉÑù¡£¶ÔÓÚ¾ßÓÐ²ÎÊý \£¨{{\Theta }}\subseteq {{\mathbb{R}}}^{p}\£©£¨Í¨³£ÊÇÈ¨ÖØºÍÆ«²î£©µÄ DNN \£¨{{{\mathcal{N}}}}}}£¨{{\theta }}\£©\£©£¨Í¨³£ÊÇÈ¨ÖØºÍÆ«²î£©£¬ÑµÁ·¼¯µÄ×¼È·ÐÔ¿ÉÒÔÍ¨¹ýËðÊ§º¯Êý \£¨L£¨{\hat{y}}_{i}£¬{y}_{i}£©\£© À´²¶»ñ£¬¸Ãº¯Êý²âÁ¿ÊäÈë x µÄ½Ó½ü³Ì¶ÈÎÒ£¬Ôò DNN µÄÔ¤²â \£¨{\hat{y}}_{i}\£© ÊÇÕæÊµ±êÇ© yÎÒ.ÑµÁ·Í¨³£ÊÇÍ¨¹ýËæ»úÌÝ¶ÈÏÂ½µ £¨SGD£© µÄÄ³ÖÖ±äÌåÍê³ÉµÄ£¬ËüÊ¹ÓÃ \£¨L£¨{\hat{y}}_{i}£¬{y}_{i}£©\£© µÄµ¼ÊýÀ´µ÷Õû²ÎÊý Θ£¬ÒÔ×î´óÏÞ¶ÈµØ¼õÉÙ S ÉÏµÄËðÊ§¡£ÓÉÓÚ DNN µÄ±í´ïÄÜÁ¦·Ç³£Ç¿£¬²¢ÇÒÓÉÓÚ SGD Í¨³£ÊÇ DNN µÄ¸ßÐ§ÓÅ»¯Æ÷£¬Òò´Ë S ÉÏµÄ£¨½Ó½ü£©ÁãÑµÁ·Îó²î£¨ãÐÖµºóËùÓÐÕýÈ·µÄ±êÇ©£©Í¨³£¿ÉÊµÏÖ7.

º¯ÊýºÍ¸ÐÓ¦Æ«ÖÃ

¶ÔÓÚ·ÖÀà£¬ÎªÊ²Ã´¹ý¶È²ÎÊý»¯µÄ DNN ²»»á¹ý¶ÈÄâºÏµÄÎÊÌâ¿ÉÒÔ·½±ãµØÓÃº¯ÊýÀ´±íÊ¾¡£¶ÔÓÚ¸ø¶¨µÄÑµÁ·¼¯ S ºÍ²âÊÔ¼¯ T£¬¿ÉÒÔÔÚÊÜÏÞÓò S + T ÉÏ¶¨Òåº¯Êý f¡£f µÄÊäÈëÊÇ xÎÒ ∈ S ∪ T£¬Êä³ö°üÀ¨ËùÓÐ¿ÉÄÜµÄ±êÇ©¼¯ \£¨\{{\hat{y}}_{i}\}\£©¡£Ö»ÓÐÒ»¸öº¯Êý¸ø³ö true ±êÇ© {yÎÒ}.¶ÔÓÚÒ»×é¸ø¶¨µÄ²ÎÊý Θ£¬DNN ±íÊ¾Ò»¸öÌØ¶¨µÄº¯Êý f£¬¸Ãº¯Êý¿ÉÒÔÍ¨¹ýËüÔÚÊäÈë x ÉÏÊä³öµÄ±êÇ©À´Ê¶±ðÎÒ ãÐÖµºó ∈ S ∪ T¡£ÔÚ¿ÉÒÔÊµÏÖÁãÑµÁ·Îó²îµÄ¼ÙÉèÏÂ£¬º¯ÊýÖ»ÐèÍ¨¹ýËüÃÇÔÚ²âÊÔ¼¯ T ÉÏµÄÐÐÎªÀ´Çø·Ö¡£¶ÔÓÚ C Àà£¬ÓÐ N ¸öT = C¨OT¨O¿ÉÄÜµÄº¯Êý f ÔÚÑµÁ·¼¯ÉÏÎó²îÎªÁã£¬ÔòÕâ¸öÊý×ÖÍ¨³£´óµÃÄÑÒÔÏëÏó¡£ÕâÐ©º¯ÊýÖÐµÄ¾ø´ó¶àÊý¶¼²»»áºÜºÃµØ·º»¯¡£ÓÉÓÚ DNN ¾ßÓÐºÜÇ¿µÄ±í´ïÄÜÁ¦£¬Òò´ËËüÃÇÓ¦¸ÃÄÜ¹»±íÊ¾ËùÓÐ£¨»ò¼¸ºõËùÓÐ£©ÕâÐ©º¯Êý¡£¹ý¶È²ÎÊý»¯ DNN ÐÔÄÜµÄ¸ù±¾ÎÊÌâ±ä³ÉÁË¹éÄÉÆ«²îµÄÎÊÌâ£ºÎªÊ²Ã´ DNN ÔÚÄÑÒÔÏëÏóµÄ´óÁ¿ S Îó²îÎªÁãµÄº¯ÊýÖÐ£¬»áÊÕÁ²µ½·º»¯Ð§¹ûºÜºÃµÄ¼«Ð¡º¯Êý×Ó¼¯£¿ÔÚÕâÀï£¬ÎÒÃÇ½«ÂÛÖ¤½á¹¹»¯Êý¾ÝºÍÌØ¶¨µÄ°Â¿¨Ä·Ìêµ¶°ãµÄ¹éÄÉÆ«ÏòÓÚ¼òµ¥º¯ÊýµÄ½áºÏ£¬µÖÏûÁËËæ×Å¸´ÔÓÐÔµÄÔö¼Ó¶øº¯ÊýÊýÁ¿µÄÖ¸ÊýÔö³¤£¬ÕâÓÐÖúÓÚ»Ø´ðÕâ¸öÎÊÌâ¡£

Çø·Ö¹ØÓÚ·º»¯µÄÁ½¸öÎÊÌâ

ÎÒÃÇÔÚÕâÀï½â¾öµÄÖ÷ÒªÎÊÌâÊÇÎÒÃÇËùËµµÄ·º»¯Ò»½×ÎÊÌâ – ÎªÊ²Ã´´óÈÝÁ¿Ñ§Ï°Ä£ÐÍ£¨ÀýÈç DNN£©»á·º»¯£¿– ¹éÄÉÆ«²îÈçºÎÈÃ DNN ´òÆÆ¾µäÑ§Ï°ÀíÂÛµÄ´«Í³Æ«²î-·½²îÈ¨ºâÆÚÍûµÄÎÊÌâÓÉÀ´ÒÑ¾Ã¡£ÀýÈç£¬Leo Breiman ÔÚ 1995 Äê¹ØÓÚ NeurIPS »áÒé²ÃÅÐµÄÆÀÂÛÖÐ¾ÍÇ¿µ÷ÁËÕâÒ»µã3£¨Áí¼û¸½Â¼ A£©ËÍ¨¹ýÎÊ“ÎªÊ²Ã´ÑÏÖØ¹ý¶È²ÎÊý»¯µÄÉñ¾ÍøÂç²»¹ý¶ÈÄâºÏÊý¾Ý£¿ËäÈ»×î³õÊÇÎª DNN ÖÆ¶¨µÄ£¬µ« DNN µÄÎÞÏÞ¿í¶ÈÏÞÖÆ¿ÉÒÔ¼ò»¯ÎªÉñ¾ÍøÂç¸ßË¹¹ý³Ì £¨NNGP£©10¡¢11¡¢12»òÄÚºË£¨Èç Neural Tangent Kernel£©13£¬¼¤·¢ÁË´óÁ¿¹ØÓÚ GP ºÍÄÚºËµÄÖØÒªÀíÂÛ¹¤×÷£¬²Î¼ûÀýÈç£¬14,15 Ôª.ÌØ±ðÊÇ£¬ÕâÐ©Ä£ÐÍ¸ÅÀ¨ÁËÓÐÏÞ¿í¶È DNN µÄÐí¶àÊôÐÔ£¬°üÀ¨ÔÚ±ê×¼Êý¾Ý¼¯£¨Èç CIFAR1016,17 Ôª.ËäÈ»ÕâÐ©·½·¨ÊÇ·Ç²ÎÊýµÄ£¬µ«ËüÃÇ¾ßÓÐºÜ¸ßµÄÈÝÁ¿£¬²¢ÇÒÓë DNN ÀàËÆ7£¬¿ÉÒÔ¼ÇÒäËæ»úÊý¾Ý14.¶ÔÓÚÐ¡ÈÝÁ¿£¨»òÉÙÓÚ DNN Êý¾ÝµãµÄ²ÎÊý£©£¬ËùÓÐÕâÐ©Ä£ÐÍ¶¼±íÏÖ³ö¾µäµÄÆ«²î-·½²îÈ¨ºâ£¬ÔÚÖÐµÈÈÝÁ¿ÏÂ¾ßÓÐ×î¼ÑµÄ·º»¯ÐÔÄÜ¡£µ«ÊÇ£¬Ëæ×ÅÈÝÁ¿£¨»ò²ÎÊýÊýÁ¿£©µÄ½øÒ»²½Ôö¼Ó£¬·º»¯Îó²î»áÏÔÖø¼õÐ¡¡£ÕâÖÖÏÖÏó³ÆÎªË«ÏÂ½µ18ÔÚ DNN¡¢ÄÚºËºÍ GP ÖÐ¹Û²ìµ½£¬ËµÃ÷ÁËÕâÐ©¸ßÈÝÁ¿Ä£ÐÍÈçºÎÆ«Àë¾µäÍ³¼ÆÑ§Ï°ÀíÂÛµÄ´«Í³ÖÇ»Û

Óë DNN Ïà±È£¬GP ºÍºËµÄÏà¶Ô¼òµ¥ÐÔÊ¹µÃÄÜ¹»¸ù¾ÝºËÌØÕ÷º¯ÊýºÍÌØÕ÷ÖµÍÆµ¼³ö·º»¯Îó²îµÄ½âÎö¹À¼Æ15¡¢19¡¢20¡¢21¡¢22¡¢23 Ôª.µ±¾ßÓÐ½Ï´óÌØÕ÷ÖµµÄºËÌØÕ÷º¯ÊýÓëÕýÔÚÑ§Ï°µÄÄ¿±êº¯Êý·Ç³£ÎÇºÏÊ±£¬¾Í»á³öÏÖÁ¼ºÃµÄ·º»¯¡£Òò´Ë£¬ÕâÐ©·ÖÎöÌá¹©ÁËÒ»¸ö¶¨Á¿²âÁ¿£¬¿ÉÒÔ¾«È·µØºâÁ¿¸ßÈÝÁ¿ÄÚºËµÄ¹éÄÉÆ«²î±ØÐëÓëÑ§Ï°ÈÎÎñµÄ¹éÄÉÆ«²îÈçºÎ±£³ÖÒ»ÖÂ¡£È»¶ø£¬ËüÃÇ²¢Ã»ÓÐ¶ÔÕâÐ©Ä£ÐÍÖÐ¹éÄÉÆ«²îµÄÐÔÖÊºÍÆðÔ´Ìá¹©¸ü¹ã·ºµÄ½âÊÍ£¬Ò²Ã»ÓÐÌá¹©ÎªÊ²Ã´Ëü¾³£ÓëËüÃÇÑµÁ·µÄÊý¾ÝÏàÆ¥Åä¡£ÕâÊÇÎÒÃÇÔÚÕâÀïÒª³¢ÊÔ½â¾öµÄ´óÎÊÌâ¡£

ÎÒÃÇÏë½«ÉÏÃæ¸ü¹ã·ºµÄÒ»½×ÎÊÌâÓë¸ü¾ßÌåµÄ¶þ½×·º»¯ÎÊÌâÇø·Ö¿ªÀ´——¸ø¶¨Ò»¸ö·º»¯ÄÜÁ¦Ïàµ±ºÃµÄ¸ßÈÝÁ¿ DNN£¨ÀýÈç£¬Ëü½â¾öÁËÒ»½×¹ý¶È²ÎÊý»¯/´óÈÝÁ¿ÎÊÌâ£©£¬ÎÒÃÇÄÜ·ñÁË½âÈçºÎ½øÒ»²½Ìá¸ßËüµÄÐÔÄÜ£¿——µÚ¶þ¸öÎÊÌâ¶ÔÉî¶ÈÑ§Ï°´ÓÒµÕßÖÁ¹ØÖØÒª£º¼Ü¹¹µÄ±ä»¯£¬ ³¬²ÎÊýÓÅ»¯¡¢Êý¾ÝÔöÇ¿µÈ¿ÉÒÔÏÔÖøÌá¸ß»ù±¾ Vanilla DNN µÄÐÔÄÜ¡£È»¶ø£¬ÕâÐ©µ÷ÕûºÍ¼¼ÇÉÊÇ´Ó´óÈÝÁ¿Ä£ÐÍµÄ»ù´¡¿ªÊ¼µÄ£¬¸ÃÄ£ÐÍÒÑ¾»ìÏýÁË¾µäÑ§Ï°ÀíÂÛµÄÆÚÍû¡£ÓÉÓÚÕâÁ½¸öÎÊÌâÓÐÊ±»á»ìÎªÒ»Ì¸£¬Òò´ËÎÒÃÇÏëÔ¤ÏÈÇ¿µ÷£¬±¾ÎÄ½«ÖØµã½éÉÜÓëËùÓÐ¸ßÈÝÁ¿Ä£ÐÍÏà¹ØµÄÒ»½×ÎÊÌâ¡£¸üºÃµØÁË½âÕâ¸ö»ù±¾ÎÊÌâÓ¦¸ÃÓÐÖúÓÚ¹¹½¨ÓÐ¹Ø½øÒ»²½Ìá¸ß DNN ÐÔÄÜµÄÖØÒª¶þ½×ÎÊÌâ¡£

Ñ§Ï°²¼¶ûº¯Êý£ºÄ£ÐÍÏµÍ³

ÊÜµ½ÑÐ¾¿Ä£ÐÍÏµÍ³µÄÆô·¢3,4£¬ÎÒÃÇÊ×ÏÈÑÐ¾¿È«Á¬½ÓÍøÂç £¨FCN£© ÈçºÎÑ§Ï°²¼¶ûº¯Êý f£º {0£¬ 1}n→ {0£¬ 1}£¬ËüÃÇÊÇ¼ÆËã»ú¿ÆÑ§µÄ¹Ø¼üÑÐ¾¿¶ÔÏó¡£¾ÍÏñ Ising Ä£ÐÍ¶Ô´ÅÑ§µÄ×÷ÓÃÒ»Ñù£¬Õâ¸ö¼òµ¥µ«Í¨ÓÃµÄÄ£ÐÍÊ¹ÎÒÃÇÄÜ¹»²¶×½µ½¹ý¶È²ÎÊý»¯ÎÊÌâµÄ±¾ÖÊ£¬Í¬Ê±±£³Ö¸ß¶È¿É´¦ÀíÐÔ¡£¶ÔÓÚ´óÐ¡Îª n µÄÏµÍ³£¬ÓÐ 2 ¸öninputs ºÍ \£¨{2}^{{2}^{n}}\£© ²¼¶ûº¯Êý¡£¸ø¶¨Ò»¸ö²¼¶ûÄ¿±êº¯Êý ft£¬DNN ÔÚ m < 2 µÄ×Ó¼¯ S ÉÏÑµÁ·ninputs£¬È»ºó¶ÔÓÉÆäÓàÊäÈë×é³ÉµÄ²âÊÔ¼¯ T Ìá¹©Ô¤²â¡£¸ÃÏµÍ³µÄÒ»¸ö¹Ø¼üÓÅÊÆÊÇ£¬Êý¾Ý¸´ÔÓÐÔ¿ÉÒÔºÜÈÝÒ×µØÍ¨¹ýÑ¡ÔñÄ¿±êº¯Êý ft.´ËÍâ£¬¸ÃÄ£ÐÍµÄ¿É´¦ÀíÐÔÊ¹ÎÒÃÇÄÜ¹»¼ÆËã²»Í¬º¯ÊýºÍÄ¿±êµÄÏÈÑé P£¨f£©¡¢ËÆÈ»¡¢P£¨S¨Of£© ºÍºóÑé P£¨f¨OS£©£¬´Ó¶ø´ÓÖÐ×ª»»¼Ü¹¹¡¢ÑµÁ·Ëã·¨ºÍ½á¹¹»¯Êý¾ÝµÄÈý·½Ä£Ê½4±ä³É½Ì¿ÆÊéÊ½µÄ±´Ò¶Ë¹Í¼¾°¡£

½á¹û

ÓÃ±´Ò¶Ë¹ÏÈÑéÁ¿»¯¹éÄÉÆ«²î

ÏÈÑéº¯Êý P£¨f£© ÊÇ DNN \£¨{{{\mathcal{N}}}}£¨{{\Theta }}£©\£© ÔÚ²ÎÊý³õÊ¼»¯·Ö²¼ P ÉÏ¶Ô²ÎÊý½øÐÐËæ»ú²ÉÑùÊ±±íÊ¾ f µÄ¸ÅÂÊ㩱(Θ):

ÆäÖÐ \£¨{\mathbb{1}}\£© ÊÇÒ»¸öÖ¸Ê¾º¯Êý£¨Èç¹ûÆä²ÎÊýÎª true£¬ÔòÎª 1£¬·ñÔòÎª 0£©¡£Ã÷È·µØËµ£¬Èç¹ûÉñ¾ÍøÂç \£¨{{{\mathcal{N}}}}£¨{{\Theta }}£©\£© ÓÃ²ÎÊý Θ ±íÊ¾ f£¬·ñÔòÎª 0£¬Ôò´ËÏîÎª 1¡£ËüÔÚ²Î¿¼ÎÄÏ×ÖÐÏÔÊ¾¡£24¶ÔÓÚ ReLU ¼¤»îº¯Êý£¬²¼¶ûÏµÍ³µÄ P£¨f£© ¶Ô P µÄ²»Í¬Ñ¡Ôñ²»Ãô¸Ð㩱£¨Θ£©£¬²¢ÇÒËü±íÏÖ³ö \£¨P£¨f£©\lesssim {2}^{-a\tilde{K}£¨f£©+b}\£© ÐÎÊ½µÄÖ¸ÊýÆ«²î£¬Ö¸ÏòÃèÊö¸´ÔÓ¶È½ÏµÍµÄ¼òµ¥º¯Êý \£¨\tilde{K}£¨f£©\£©£¬ÕâÊÇÕæÊµ£¨µ«²»¿É¼ÆËãµÄ£©¿Â¶ûÄª¸êÂå·ò¸´ÔÓ¶ÈµÄ´úÀí¡£ÎÒÃÇ»áµÄ£¬Èç ref.24£¬Ê¹ÓÃ C ¼ÆËã \£¨\tilde{K}£¨f£©\£©LZ£¬À´×Ô ref.25ÔÚ 2nÃèÊöº¯ÊýµÄ long bitstring£¬²ÉÓÃÓÐÐòµÄ inputs ÁÐ±í¡£ÆäËû¸´ÔÓ¶È¶ÈÁ¿¸ø³öÀàËÆµÄ½á¹û24,26 Ôª£¬Òò´Ë´ËÌØ¶¨Ñ¡ÔñÃ»ÓÐÈÎºÎ»ù±¾ÄÚÈÝ¡£ÎªÁË¼ò»¯·ûºÅ£¬ÎÒÃÇ½«Ê¹ÓÃ K£¨f£© ¶ø²»ÊÇ \£¨\tilde{K}£¨f£©\£©¡£ÔÚ´Ó²ÎÊýµ½º¯ÊýµÄÓ³ÉäÖÐ£¬P£¨f£© Óë K£¨f£© µÄÖ¸ÊýÏÂ½µÓëËã·¨ÐÅÏ¢ÂÛ £¨AIT£© ±àÂë¶¨ÀíÒ»ÖÂ27Inspired Simplicity Æ«¼û25ÕâÊÊÓÃÓÚ¸ü¹ã·ºµÄÊäÈë-Êä³öÓ³Éä¼¯¡£ËüÔÚ²Î¿¼ÎÄÏ×ÖÐÕùÂÛµÀ¡£24Èç¹ûÏÈÑéÖÐµÄÕâÖÖ¹éÄÉÆ«²îÓë½á¹¹»¯Êý¾ÝµÄ¼òµ¥ÐÔÏàÆ¥Åä£¬ÄÇÃ´Ëü½«ÓÐÖúÓÚ½âÊÍÎªÊ²Ã´ DNN µÄ·º»¯Ð§¹ûÈç´ËÖ®ºÃ¡£È»¶ø£¬¸Ã×÷Æ·µÄÈõµã£¬ÒÔ¼°ÕùÂÛÕâÖÖÆ«ÏòÓÚ¼òµ¥µÄ×÷Æ·Æ±¼Û£º24,26,28,29,30,31,32,33,34,35 Ôª£¬ÒòÎªÍ¨³£²»¿ÉÄÜÏÔÖø¸Ä±äÕâÖÖ¶Ô¼òµ¥ÐÔµÄ¹éÄÉÆ«²î£¬Òò´ËºÜÄÑ×îÖÕÖ¤Ã÷²úÉúÁ¼ºÃÐÔÄÜµÄ²»ÊÇÍøÂçµÄÆäËûÊôÐÔ¡£ÔÚÕâÀï£¬ÎÒÃÇÀûÓÃÁË \£¨\tanh\£© ¼¤»îº¯ÊýµÄÌØÊâÐÔ£¬ËüÊ¹ÎÒÃÇÄÜ¹»ÏÔ×Å¸Ä±ä DNN µÄ¹éÄÉÆ«ÖÃ¡£ÌØ±ðÊÇ£¬¶ÔÓÚ¸ßË¹ P㩱£¨Θ£© Óë±ê×¼²î σw£¬Ëü±»ÏÔÊ¾36,37 ÔªÄÇ£¬¾ÍÏñσwÔö¼Ó£¬Ôò¹ý¶Éµ½»ìÂÒµÄÕþÈ¨¡£´ËÍâ£¬×î½üÖ¤Ã÷ P£¨f£© µÄ¼òµ¥ÐÔÆ«²îÔÚ»ìãç×´Ì¬ÏÂ±äµÃ¸üÈõ38£¨Áí¼û²¹³äËµÃ÷ 3£©¡£ÎÒÃÇ½«ÀûÓÃÕâÖÖÐÐÎªÀ´ÏµÍ³µØ¸Ä±äÏÈÑéº¯ÊýÉÏµÄ¹éÄÉÆ«ÖÃ¡£

ÔÚÍ¼ .1a£¬ b ÎÒÃÇÃèÊöÁËÔÚ¶Ô¾ßÓÐ 10 ²ãºÍÒþ²Ø¿í¶È 40 µÄ FCN µÄ²ÎÊý½øÐÐËæ»ú²ÉÑùÊ±£¬ÔÚ n = 7 ²¼¶ûÏµÍ³µÄËùÓÐ 128 ¸öÊäÈëÉÏ¶¨ÒåµÄº¯Êý f µÄÏÈÑé¸ÅÂÊ P£¨f£©£¨Õâ¶ÔÓÚ¸ÃÏµÍ³À´ËµÊÇ¿ÉÖ¤Ã÷µÄÍêÈ«±í´ïµÄ31£© ºÍ \£¨\tanh\£© ¼¤»îº¯Êý¡£P£¨f£© ÖÐµÄ¼òµ¥ÐÔÆ«²îËæ×Å¿í¶ÈµÄÔö¼Ó¶ø±äÈõσw¸ßË¹ P㩱(σw£© Ôö¼Ó¡£Ïà±ÈÖ®ÏÂ£¬¶ÔÓÚ ReLU ¼¤»î£¬P£¨f£© µÄÆ«²î¼¸ºõ²»Ëæ σw£¨¼ûÍ¼S3a£© µÄ S¼òµ¥ÐÔÆ«²îµÄ¼õÉÙ¶Ô DNN ·º»¯ÐÔÄÜµÄÓ°ÏìÈçÍ¼ 2 ËùÊ¾¡£1c ±íÊ¾ÔÚ´óÐ¡Îª m = 64 µÄÑµÁ·¼¯ S ÉÏÑµÁ·ÎªÁãµÄ DNN£¬Ê¹ÓÃ advSGD£¨È¡×Ô ref.24£©£¬²¢ÔÚÆäËû 64 ¸öÊäÈë x ÉÏ½øÐÐ²âÊÔÎÒ ∈ T.·º»¯Îó²î£¨T ÉÏ´íÎóÔ¤²âµÄ±ÈÀý£©ËæÄ¿±êº¯ÊýµÄ¸´ÔÓ¶È¶ø±ä»¯¡£¾¡¹ÜËùÓÐÕâÐ© DNN ¶¼±íÏÖ³ö¼òµ¥ÐÔÆ«²î£¬µ«½ÏÈõµÄÆ«²îÐÎÊ½¶ÔÓ¦ÓÚ¶Ô¸ü¼òµ¥Ä¿±êµÄ·º»¯Ã÷ÏÔ½Ï²î£¨ÁíÇë²Î¼û²¹³äËµÃ÷ 10£©¡£¶ÔÓÚ·Ç³£¸´ÔÓµÄÄ¿±ê£¬ÕâÁ½¸öÍøÂçµÄÐÔÄÜ¶¼ºÜ²î¡£×÷Îª²Î¿¼£¬ÎÒÃÇ»¹Õ¹Ê¾ÁËÒ»¸öÎÞÆ«µÄÑ§Ï°Æ÷£¬ÆäÖÐº¯Êý f ÊÇËæ»ú¾ùÔÈÑ¡ÔñµÄ£¬¸½´øÌõ¼þÊÇËüÃÇÍêÈ«ÊÊºÏÑµÁ·¼¯ S¡£ºÁ²»Ææ¹Ö£¬¿¼ÂÇµ½ 264≈ 2 × 1019º¯Êý£¬ÔòÕâ¸öÎÞÆ«Ñ§Ï°Æ÷µÄÐÔÄÜ²¢²»±ÈËæ»ú»ú»áºÃ¡£

Í¼ 1£ºº¯ÊýºÍ¸´ÔÓÐÔµÄÏÈÑé¡£

Í¼ 1

a ÏÈÑé P£¨f£© ±íÊ¾ Nl¾ßÓÐ \£¨\tanh\£© ´Î¼¤»îµÄ²ã FCN Éú³É n = 7 ¸ö²¼¶ûº¯Êý f£¬°´µ¥¸öº¯ÊýµÄ¸ÅÂÊÅÅÐò£¬´Ó 10 Éú³É8²ÎÊý Θ ÔÚ¸ßË¹ P ÉÏµÄËæ»úÑù±¾㩱£¨Θ£©£¬±ê×¼²îÎª σw= 1...8. »¹±È½ÏÁË ReLU ¼¤»îµÄ DNN¡£À¶É«ÐéÏß±íÊ¾ Zipf ¶¨ÂÉÏÈÑé24 \£¨P£¨f£©=1/£¨£¨128\ln 2£©Rank£¨f£©£©\£©¡£b P£¨f£© Óë LZ ¸´ÔÓ¶È K µÄ¹ØÏµ£¨¶ÔÓÚ £¨a£© ÖÐµÄÍøÂç¡£cÎÞÆ«Ñ§Ï°Æ÷£¨ÂÌÉ«£©ºÍ\£¨{\sigma }_{w}=1,8\£¬\tanh\£©ÍøÂçµÄ·º»¯Îó²îÓëÄ¿±êº¯ÊýµÄKµÄ¹ØÏµ£¬advSGDÑµÁ·µ½ÁãÎó²î24¶ÔÓÚ´óÐ¡Îª m = 64 µÄÑµÁ·¼¯ S µÄ½»²æìØËðÊ§£¬¶ÔÓÚ 1000 ´ÎËæ»ú³õÊ¼»¯¡£Îó²îÊÇ¸ù¾ÝÊ£ÓàµÄ ¨OT¨O = 64 ¸öº¯Êý¼ÆËãµÄ¡£Îó²îÏßÊÇÒ»¸ö±ê×¼²î£¨¼ûÍ¼ 1£©¡£S17 ±íÊ¾´ËÊý¾ÝÉÏµÄ PAC-Bayes ±ß½ç£©¡£d¡¢e¡¢f ·º»¯Îó²îÓëÑ§Ï°º¯Êý LZ ¸´ÔÓÐÔµÄÉ¢µãÍ¼£¬À´×Ô×ÓÍ¼ £¨c£© ÖÐÈý¸öÄ¿±êº¯ÊýµÄ 1000 ´ÎËæ»ú³õÊ¼»¯¡£´¹Ö±ÐéÏß±íÊ¾Ä¿±êº¯Êý¸´ÔÓ¶È¡£ºÚÉ«²æºÅ±íÊ¾ mode º¯Êý¡£Í¼¶¥²¿£¨²àÃæ£©µÄÖ±·½Í¼ÏÔÊ¾ÑµÁ·ºóµÄºóÑé¸ÅÂÊÓë¸´ÔÓ¶ÈµÄº¯Êý¹ØÏµ£¬PÐÂ±Ò(K¨OS£© £¨Îó²î£¬PÐÂ±Ò(εG¨OS£©£©¡£g ¶ÔÓÚ¾ùÔÈËæ»ú²ÉÑù 10£¬»ñµÃ LZ ¸´ÔÓ¶È K º¯ÊýµÄÏÈÑé¸ÅÂÊ P£¨K£©8ÓëÀíÂÛÉÏµÄÍêÃÀÑ¹ËõÆ÷Ïà±È¡£90% µÄ¸ÅÂÊÖÊÁ¿Î»ÓÚ´¹Ö±ÐéÏßµÄÓÒ²à£¬ÐéÏß±íÊ¾¶ÔµÍ K µÄÍâÍÆ¡£h P£¨K£© ÔÚ K ÉÏÏà¶Ô¾ùÔÈσw= 1 ¸öÏµÍ³£¬¶ø σw= 8 ¸öÍøÂç¡£ÕâÐ©ÏÈÑéµÄ¾Þ´ó²îÒìÓÐÖúÓÚ½âÊÍ DNN ÐÔÄÜµÄÏÔÖø±ä»¯¡£i σ µÄ K-learning ÏÞÖÆµÄ·º»¯Îó²îw= 1£¬ 8 ¸ö DNN£¬¶ÔÓÚÎÞÆ«Ñ§Ï°Æ÷£¬È«²¿Îª ¨OS¨O = 100¡£εSÊÇÑµÁ·Îó²î£¬εGÊÇ²âÊÔ¼¯ÉÏµÄ·º»¯Îó²î¡£´¹Ö±ÐéÏßÊÇ¸´ÔÓ¶È KtµÄÄ¿±ê¡£»¹±È½ÏÁËÎÞÆ«Ñ§Ï°ÕßµÄ±ê×¼¿ÉÊµÏÖ PAC ºÍ±ß¼ÊËÆÈ» PAC-Bayes ±ß½ç¡£ÔÚ 104ÑùÆ·ÖÐ£¬Î´ÕÒµ½ K ≲ 70 µÄÈÜÒºσw= 8 DNN£¬σ K ≳ 70 w= 1 DNN µÄ DNN ÖÐ¡£

È«³ß´çÍ¼Ïñ

Í¼ 1 µÄÉ¢µãÍ¼1d-f ¸ü¾«Ï¸µØÃè»æÁË SGD ÑµÁ·ÍøÂç¶ÔÈýÖÖ²»Í¬Ä¿±êº¯ÊýµÄÐÐÎª¡£¶ÔÓÚÃ¿¸öÄ¿±ê£¬SGD ÓÅ»¯Æ÷µÄ 1000 ´Î¶ÀÁ¢³õÊ¼»¯£¬³õÊ¼²ÎÊýÈ¡×Ô P㩱(σw£©¡£»æÖÆÁË DNN Ê×´Î´ïµ½ÁãÑµÁ·Îó²îÊ±·¢ÏÖµÄÃ¿¸öº¯ÊýµÄ·º»¯Îó²îºÍ¸´ÔÓÐÔ¡£ÓÉÓÚÓÐ 2 ¸ö64¿ÉÄÜµÄº¯ÊýÔÚÑµÁ·¼¯ S ÉÏ¸ø³öÁãÎó²î£¬Òò´Ë DNN ÔÚ²»Í¬µÄËæ»ú³õÊ¼»¯Ê±ÊÕÁ²µ½Ðí¶à²»Í¬µÄº¯ÊýÒ²¾Í²»×ãÎªÆæÁË¡£¶ÔÓÚσw= 1 ¸öÍøÂç£¨ÆäÖÐ P£¨f£© ÀàËÆÓÚ ReLU ÍøÂç£©£¬×î³£¼ûµÄº¯ÊýÍ¨³£±ÈÄ¿±êº¯Êý¼òµ¥¡£Ïà±ÈÖ®ÏÂ£¬Æ«²î½ÏÐ¡µÄÍøÂçÊÕÁ²ÓÚÍ¨³£±ÈÄ¿±ê¸ü¸´ÔÓµÄº¯Êý¡£Ëæ×ÅÄ¿±ê±¾Éí±äµÃ¸ü¼Ó¸´ÔÓ£¬Á½¸ö·º»¯Îó²îÖ®¼äµÄÏà¶Ô²îÒì»á¼õÐ¡£¬ÒòÎª¶ÔµÚÒ»¸öÍøÂçµÄ¼òµ¥º¯ÊýµÄÇ¿ÁÒ¹éÄÉÆ«²î±äµÃ²»ÄÇÃ´ÓÐÓÃ¡£¼à¶½Ñ§Ï°Ã»ÓÐÃâ·ÑµÄÎç²Í¶¨Àí¸æËßÎÒÃÇ£¬µ±¶ÔËùÓÐÄ¿±êº¯Êý½øÐÐÆ½¾ùÊ±£¬ÉÏÊöÈý¸öÑ§Ï°Æ÷µÄ±íÏÖ½«Í¬ÑùÔã¸â39,40 Ôª£¨Áí¼û²¹³äËµÃ÷ 43£©¡£

ÏÈÑéÊ¤ÓÚ¸´ÔÓÐÔ

ÒªÀí½âÎªÊ²Ã´¹éÄÉÆ«ÏòÓÚ¼òµ¥µÄÏà¶ÔÊÊ¶ÈµÄ±ä»¯»áµ¼ÖÂ·º»¯ÐÔÄÜµÄÈç´ËÏÔ×Å²îÒì£¬ÎÒÃÇÐèÒªÁíÒ»¸öÖØÒªÒòËØ£¬¼´º¯ÊýµÄÊýÁ¿ÈçºÎËæ¸´ÔÓÐÔ¶ø±ä»¯¡£»ù±¾¼ÆÊý²ÎÊýÒâÎ¶×Å¸´ÔÓ¶ÈÎª K µÄ¹Ì¶¨³¤¶È×Ö·û´®µÄÊýÁ¿³ÊÖ¸ÊýËõ·ÅÎª 2K 27.Òò´Ë£¬Ëæ»úÑ¡ÔñµÄ¾ø´ó¶àÊýº¯Êý½«¾ßÓÐºÜ¸ßµÄ¸´ÔÓ¶È¡£¾ßÓÐ¸´ÔÓ¶ÈµÄº¯ÊýÊýÁ¿µÄÕâÖÖÖ¸ÊýÔö³¤¿ÉÒÔÓÃ¸ü´ÖÁ£¶ÈµÄÏÈÑéÀ´²¶»ñ£¬¼´ DNN ÔÚ²ÎÊý³õÊ¼»¯º¯Êý P ÉÏ¶Ô²ÎÊý½øÐÐËæ»ú²ÉÑùÊ±±íÊ¾¸´ÔÓ¶È K º¯ÊýµÄ¸ÅÂÊ P£¨K£©㩱£¨Θ£©£¬Ò²¿ÉÒÔÓÃº¯ÊýÐ´³É \£¨P£¨{K}^{{\prime} }£©={\sum }_{f\in {{{{\mathcal{H}}}}}_{{K}^{{\prime} }}}P£¨f£©\£©£¬¼´ËùÓÐ¸´ÔÓ¶ÈÎª \£¨\tilde{K}£¨f£©={K}^{{\prime} }\£© µÄ¼¯ºÏ \£¨{{{{\mathcal{H}}}}}_{{K}^{{\prime} }}\£© µÄ¼ÓÈ¨ºÍ¡£ÔÚÍ¼ .1 g P£¨K£© ±íÊ¾ 10 µÄº¯ÊýµÄ¾ùÔÈËæ»ú²ÉÑù8Ê¹ÓÃ LZ ²â¶ÈµÄÑù±¾£¬ÒÔ¼° \£¨P£¨K£©={2}^{K-{K}_{max}-1}\£© ÔÚËùÓÐ 2 ÉÏ128≈ 3 × 1038¹¦ÄÜ£¨Áí¼û²¹³äËµÃ÷ 9£©¡£ÔÚ £¨h£© ÖÐ£¬ÎÒÃÇÏÔÊ¾²»ÊÇËæ»ú²ÉÑùµÄº¯ÊýµÄ P£¨K£©£¬¶øÊÇ´ÓÁ½¸öÍøÂçÖÐ²ÉÑùµÄº¯Êý¡£Ëæ»ú²ÉÑùº¯Êý£¨Èç £¨g£©£©ºÍ¾ßÓÐ σ µÄÍøÂçÖ®¼ä´æÔÚ¾Þ´ó²îÒìw= 1£¬ÆäÖÐ P£¨K£© ¼¸ºõ³ÖÆ½¡£ÕâÖÖÐÐÎªÔ´ÓÚÒ»¸öÓÐÈ¤µÄÊÂÊµ£¬¼´ AIT ±àÂë¶¨Àí°ãµÄËõ·Å24,25 ÔªµÄÏÈÑé over º¯Êý \£¨P£¨f£© \sim {2}^{-\tilde{K}£¨f£©}\£© µÖÏû 2Kº¯ÊýÊýÁ¿µÄÔö³¤

[·µ»Ø]

ÉÏÒ»Æª£ºÈË¹¤ºÍÉúÎïÉñ¾ÍøÂçÖÐÓïÑÔÓï¾³µÄÔöÁ¿»ýÀÛ
ÏÂÒ»Æª£ºÍ¨¹ýÔÎ»·´Ïò´«²¥ÑµÁ·È«»úÐµÉñ¾ÍøÂçÒÔ½øÐÐÈÎÎñÑ§Ï°