ChatGPT的狂飙之路-葫芦时刻

依法合规经营，保障用户权益是我们的生命线，对于部分广告发布者为牟取高收益侵犯用户权益行为，我司将通过法律途径追责到底！

ChatGPT的狂飙之路

发表于 2023年4月

中国农历新年刚过，一款号称史上最强的聊天机器人ChatGPT迅速火出了圈。似乎一夜之间，所有人都在玩ChatGPT，聊人工智能。

伴随着ChatGPT的高速发展，很多公司和个人的命运将会完全被改写。这是不亚于蒸汽机、铁路、电报、互联网的时代巨浪，以ChatGPT为代表的AI自生成技术，让人工智能实现从感知理解世界到生成创造世界的巨大跃迁。微软CEO纳德拉甚至认为对于知识型工作者来说，这就完全等于工业革命。

程序员曾经被认为是最难自动化的知识工作，而现在，一切都变了。一位IT行业的老炮在见识ChatGPT的编程能力后，发出感慨：“本以为不会有太多惊喜，没成想，还是吓了一跳。”在评测文章中，他还表示这一切既令人着迷，又令人惊讶，同时还令他恐惧。

毫无疑问，生成式人工智能是自移动和云计算兴起以来最引人注目的突破式技术，这种具有颠覆性的变革，将会成为数十亿人日常生活的一部分。如果说互联网引发空间革命，手机引发时间革命，那么，ChatGPT将引发“思维革命”：它改变人类思考和处理问题的方式，并由此重塑世界！

新时代的大幕，已徐徐拉开。

什么是ChatGPT？

ChatGPT（Chat Generative Pre-Trained Transformer，聊天生成式预训练转换器）是人工智能公司OpenAI开发的一种全新聊天机器人模型，它能够通过学习和理解人类语言进行对话，还能根据聊天的上下文进行互动，并协助人类完成一系列任务，因此有望成为提高办公、学习效率的工具。

这款AI语言模型让撰寫邮件、论文、脚本，制定商业提案，创作诗歌、故事，甚至敲代码、检查程序错误都变得易如反掌。不少和ChatGPT“聊过天”的网友纷纷感叹，“只有你想不到，没有ChatGPT办不成的”。

这种革命性的颠覆，让一众叱咤风云的互联网公司也明显感受到急迫性。

大家好奇，人工智能也有十几年了，AI对话更是没有激起什么水花。无论是微软的小冰，还是苹果的siri，还是阿里的天猫精灵，都没能像ChatGPT一样让人震撼。

其实说来也简单，ChatGPT如此强大，离不开背后丰富的知识储备。

用于训练ChatGPT的数据集至少包含4990亿个token（token为语言中最小的语义单位，在英文中等于一个单词，在中文中等于一个词语），覆盖海量的博客、书籍、新闻资讯、网站内容等。

ChatGPT如何学习

首先是AI学习来自网络的文本数据，得出随机答案；然后根据人工标注的问答数据微调模型，使AI一定程度上理解人类的意图，从文字接龙进入引导接龙阶段；再接着，人工对AI生成的结果进行排序，就此数据训练奖惩模型，使AI模仿人类评分标准给不同的回答打分，进入模仿喜好阶段；最后，根据打分更新参数，强化AI学习，训练AI得出高质量回答。说得通俗一点，这类训练就是让AI从人类反馈中强化学习，再用数据重新微调从而使AI更像人。

其实整个训练过程和教小朋友数学差不多。就是先上课给例题，然后给作业，再针对作业打分后挑出一些总是出错的题目再进行有针对性的练习。最关键的是，对于不同的学科和知识点，我们并不需要从头训练一个新模型，之前的机器学习都是这样的，而这一次，人类不再需要含辛茹苦数十载，进行数据训练，只要拿出之前预训练好的模型，给一些指导，一个新技能就get了。

眼下，ChatGPT正在通过和全球上亿用户的互动，不断增强自身能力。如果说以谷歌、百度为代表的搜索引擎在“寻找问题的答案”，那么ChatGPT就是直接跨越到“自主完成任务”。

本文刊登于《大众科学》2023年3期

龙源期刊网正版版权

大众科学

2023年3期

查看本期目录

更多文章来自