document.write('
') 李志飞将在大模型领域创业,做中国的 OpenAI - 唐诗宋词网
唐诗宋词网_唐诗宋词精选_唐诗三百首全集_打造中国最大的诗词网

唐诗宋词网_唐诗宋词精选_唐诗三百首全集_打造中国最大的诗词网

唐诗宋词网乃是国内知名的古诗词网站。诗词网遵循专业、精准、规范、实用的原则。里面收录唐诗、诗词、古诗词、宋词、近代诗、元曲、文言文、唐诗300首、宋词300句、李白、杜普、苏轼、等数十万精品古诗词。

菜单导航
唐诗宋词网 > 文言文 > 正文

李志飞将在大模型领域创业,做中国的 OpenAI

作者: 采集侠 更新时间: 2023年03月13日 08:32:12 游览量: 91

简述:

ChatGPT 爆火后,新的共识正在逐渐形成:语言大模型将成为下一个科技时代的超级加速器。中国也需要自己的 AI 大模

ChatGPT 爆火后,新的共识正在逐渐形成:语言大模型将成为下一个科技时代的超级加速器。中国也需要自己的 AI 大模型。而有能力做这件事的人选并不多,李志飞是其中之一。

作为科技创业圈最资深的自然语言科学家之一,李志飞出身美国约翰霍普金斯大学语言与语音处理实验室,博士期间一直研究机器翻译和自然语言处理。离开大学后,李志飞加入谷歌 AI 团队,主导开发了包括谷歌手机版离线翻译等一系列产品。2012 年,他选择回国,在语音交互领域创业,创立出门问问。

ChatGPT 火起来之后,他一个月两次前往硅谷,和来自 Open AI、谷歌、DeepMind 等各家的工程师和科学家交流取经。「AI 大模型的元年」来了,这是他最直观的感受。一番调研之后,他明白这场大模型之战,参赛选手不止巨头,也不会是只有一两个幸存者的「生存游戏」。

语言模型、人机交互,变革发生在李志飞学习、研究、工作了十几年的领域。他告诉极客公园,已经下定决心投身其中,做一个中国的语言大模型。

「我一直想做一个我能做,我喜欢做,同时也有深远价值的事情。」他表示,早在 2020 年 GPT-3 刚发布时,他就提出 GPT-3 是「暴力美学」的胜利,看到了通往 AGI 的可能性,并最早着手开发 GPT-3 中文版 UCLAI。

近日,李志飞和极客公园进行了一场近两个小时的交流,分享了自己对大模型、ChatGPT 的看法,以及自己接下来在这个领域创业的思路。

以下是对话实录,由极客公园整理。

01

「这就是 AI  

大模型时代的开启」

极客公园:怎么理解这场 ChatGPT 带来的狂热浪潮?新在什么地方?为什么大家现在这么兴奋?

李志飞 :ChatGPT 始于一个基于统计的语言模型,通过千亿级参数的训练,让它拥有了各种能力,可以快速学会各种任务。这次普通老百姓都体验到,ChatGPT 在语言表达、回答知识性的问题、多轮对话的上下文逻辑等方面的表现,带来的体验超出所有人的期望。它可以编程、做算术题、写诗,甚至某种程度上比真人做得都要好。

极客公园:除了震惊的体验本身,在创业者或者资本看来,是怎么把它看成一个变革性的商业机会的?

李志飞 :我过年第二天就再次跑到美国去,初衷就是想了解有没有人清楚这是怎么搞出来的,为什么大模型这么厉害。

我跟 Google、OpenAI、DeepMind、Meta、Amazon 的人聊,即使技术大牛都还不清楚 ChatGPT 如何拥有这种能力。但是大家能够看到很多现象。第一,用户太疯狂了;第二,美国太疯狂了,在美国知名孵化器 Y Combinator,可能有三分之一以上的项目都是基于大模型做的应用。

所有人都认为,这是 AI 大模型时代的开启,就像 2010 年移动互联网时代一样。不到硅谷,切身感受到 AIGC 的火热,我不会下定此刻是「AI 大模型时代」这一结论。我每天七八个会从早说到晚,喉咙都是哑的,都是讨论这个东西。让你觉得这就是一个时代的开端。

李志飞将在大模型领域创业,做中国的 OpenAI

图片来源:DeepMind

极客公园:对这个时间节点,很多人将其比作移动互联网的 iPhone 时刻。大家已经想清楚这是一场怎样的变革了吗?

李志飞:为什么说现在 AI 大模型出来,大家像 2010 或 2011 年的时候看移动互联网一样?我 2010 年在硅谷,当年所有人都觉得移动互联网是一个大事,但所有人也都觉得商业模式不清晰,因为屏幕太小,广告做不了,而且网络信号也不好。但是当时大家看到几个东西,比如屏幕体验已经很好了,3G 通讯也能用了,在路上发邮件查餐馆虽慢一些,但是 GPS 很准。

我对现在也有这种感觉,直觉这是一个大事情。美国创投在 2022 年 10 月已经觉醒了,当时我在美国,有一位红杉的投资者跟我说,李志飞,你的时代到了。我说为啥?他说你知道吗?在美国,红杉所有的管理合伙人只讨论 AIGC,别的项目都不看了。

极客公园:今天,投资 AIGC 还是很多 VC 的看点,但最近大家对于底层 AI 大模型的热情也涨起来了。这是什么原因?

李志飞:现在很多人把 AIGC、ChatGPT、AI 大模型搅在一起。要先理清楚这三个是不同的概念。最底层是 AI 通用大模型,上面可以做 AIGC,比如说 Midjourney 可以画画,Jasper 可以写文案等;也可以基于底层模型做对话机器人,比如基于 ChatGPT。在美国,除了 OpenAI 和巨头,还有另外三、四家创业公司也都在做 AI 通用大模型,都有大几亿美金的投入。

但是在中国,你突然发现,要进入 AI 大模型时代,根本就没有一个基本的、能玩得好的 AI 大模型,怎么做应用?如果现在是移动互联网的开端,安卓、 iOS 是不是超级重要?但是今天中国缺乏大模型时代的安卓、 iOS,所以根本没法开发应用。即使中美完全畅通,以今天中国科技的发达程度,以及资本的力量,AI 大模型肯定也是一个必须的基础设施。

极客公园:AI 大模型就是 AI 时代的操作系统级别的存在?

文章链接:http://www.vantonefound.org/wyw/61862.html

文章标题:李志飞将在大模型领域创业,做中国的 OpenAI