近几年随着各类人工智能算法与程序向日常生活领域的渗透,人工智能时代悄然来临。

概括来说,在人工智能时代,数据、算力、算法、应用是人工智能军备竞赛的四大方向。

一个国家想抓住下一个时代所带来的发展红利,以上四个方向都不能有短板。

有人说全球化的情况下,不可能任何一个国家能够成功攻克任何全产业链,但是当前国际竞争形势就是如此,美国已经在算力方面对中国的人工智能产业开启了如“智子般的锁科技”计划,如果未来想要不在人工智能领域落后,不可能永远被锁死在别人的手心里。

人工智能
人工智能

在数据方面:

训练的数据集是决定算法准确性和鲁棒性的重要前提,特别是在当下最火热的大模型和自动驾驶领域,数据是非常重要的资本,正如同第一次工业革命之后,煤炭和铁矿资源逐渐成为决定国家力量的基石,任何国家想要在世界上立足,其对矿产资源等基本资源的控制能力很重要。

而在今天,大量的重复性脑力工作开始向人工智能领域迁移,比如说繁重的文书工作交给GPT来处理,或者说在广告文章等宣传图片中大规模应用人工智能生成的图片。众所周知,人工智能在图片文字生成上有巨大的劣势,经常生成一些莫名其妙的火星文,这是因为在训练过程中缺少对图片文字的特殊处理所致的,但是未来随着算法的发展,文字+图片的合成将会取得巨大的进步。

2024年1月8日,Magnific AI创始人Javi Lopez在X上宣布,Magnific AI将于本周更新,可将图片放大至10K*10K分辨率。很多低分辨率的图片将可以提升到非常非常清晰的水平,但是在很多含有文字的图片中,分辨率的提升之后文字如何显示,如何界定文字内容的准确性,如果通过算法来提升老照片的清晰度,那么合成后的虚假的历史图片以及其文字内容是否会污染人类文明的正确历史记录,这都是值得深思的问题。

还有一个问题就是虚构的世界与历史是否算是历史,虚构的文字与解释是否适用于对世界进行解释?这应该算是一个哲学问题。

有句话叫做历史是由胜利者书写的,意思是只有获得了胜利的一方才有资格去撰写历史,记录对自己有利的一种历史结果。这句话在人工智能领域同样适用,只有足够的大的数据集才能训练出足够好的算法,但是这个数据集的真假质量内容都不一样,那么,修改了数据集就会影响最终输出的结果,如果给AI灌输了虚假的历史观念,那么AI也只会解释虚假的历史观,谁掌握了人工智能时代的数据权,那么谁也就掌握了解释一个事情或者一段历史的权利……

 

在算力方面:

英伟达当之无愧是算力之王,A100 、B100、H100、DGX、但是由于美国的制裁,国内企业基本无法使用正常渠道和正常价格获取高算力芯片,当然摩尔线程和华为等公司的替代方案也是可以的,虽然和主流算力卡有差距,但是也能保证不会完全掉队。

如果一个国家在任何渠道都无法获得加速训练算力的硬件,比如我们只能使用最基础的处理器而无法使用CUDA框架,那可能一个大模型就要落后别人十天半个月不等的训练时间,那么在部署和应用上落后的就更久了。

 

在算法层面:

东亚人特有的数学基础好和对科研人员的持续鼓(压)励(榨),比如盛行在各大高校的提高硕士博士毕业条件啦,不断的提升SCI分区要求啦,不允许发水刊啦,不断的要求青年教师等非升即走啦,没有允许失败的土壤啦等等赶鸭子上架的相关政策,可以确保我们不会在领先的人工智能算法层面掉队,只可惜生育率越来越低,就怕很多人都没有时间养育下一代了。

 

在应用层面:

我国在人工智能的应用层面算是走在世界前列了,比如市面上我们可以看到的说量产的L2水平之上的自动驾驶汽车,针对车牌识别的视觉算法,手机的照片优化算法和消除算法,百度文心一言等,抖音快手的推荐算法,甚至于超市视觉识别的智能秤,太多太多了。我们国家的优势在于能够应用人力物力成本和大量的加班时间把一个概念迅速落地抢占先机,这算是我们一直以来的优势之处吧。

 

总之,在人工智能时代,数据、算力、算法、应用是人工智能军备竞赛的四大方向。只有牢牢把握住这四个方向,才能够抢占人工智能领域的先机,本来想着写这篇文章是为了说原始数据在人工智能中的重要地位,在未来的知识传播和解释过程中占有重要的一席之地。但是题外话说了不少,毕竟我们都是身在其中的,不管人工智能领域发展如何,其都应该满足人类的需求,辅助人类的发展,贯彻人类的道德观,延续人类的文明,保障人类的生命和财产安全作为其第一要务。不然最后有一天,演变成如终结者里所描述的天网觉醒,那就为时已晚了。