出门问问内测大模型“序列猴子”，CEO李志飞：我们不融资也能支撑研发 - 商业经济

注册登录

首页 > 商业经济 > 正文

出门问问内测大模型“序列猴子”，CEO李志飞：我们不融资也能支撑研发

发布日期：2023-04-21

来源：钛媒体

作者：林志佳

出门问问内测大模型“序列猴子”，CEO李志飞：我们不融资也能支撑研发

图片来源：由无界 AI工具生成

随着人工智能（AI）竞赛加剧，最近两年极少公开露面的李志飞，这次也要加入到国内 AI 大模型浪潮中。

钛媒体App获悉，4月20日出门问问举行的2023 AIGC（生成式人工智能）战略发布会上，前Google（谷歌）科学家、出门问问创始人兼CEO李志飞宣布推出出门问问版GPT、AI 大模型“序列猴子”，并开启内测探索。

同时，出门问问还介绍多款面向创作者的CoPilot（创作助理）产品——AI写作平台“奇妙文”、AI绘画平台“言之画”、AI配音平台“魔音工坊”、数字人视频与直播平台“奇妙元”、升级版语音助手魔法小问，以及企业（To B）端专属大模型，不仅提供通用能力支持服务和数字人形象定制服务，还将开放自身角色能力，持续迭代数据接口。

李志飞对钛媒体App表示，相比OpenAI研发的GPT-3大约1750亿个参数，“序列猴子”模型参数量约为几百亿个。尽管GPT-4的100分满分相比，“序列猴子”分数是50分，但李志飞认为目前该模型效果确实超出了他的预期，他十分满意。

李志飞强调，中国OpenAI不是出门问问的目标。同时，出门问问近期不考虑融资，不需要外部融资也能支撑研发投入。

“目前公司商业化做得不错，除大模型外，公司其他业务并不太烧钱。此外，出门问问之前的融资也较充足，我们过去还是融了不少钱，所以账上还有不少钱。”李志飞对钛媒体App表示，“（大模型）可能就是我最后一次All in干的一件事情”。

据悉，成立于2012年的出门问问，是一家以语音交互和软硬结合为核心的 AI 公司，为全球40多个国家和地区的消费者、企业提供 AI 产品和服务。其中包括智能手表TicWatch系列、AI 真无线智能耳机TicPods系列等，以及物联网、金融、车载等场景提供服务，推出的“魔音工坊配音助手”用户近200万。创立出门问问之前，李志飞博士毕业于美国约翰霍普金斯大学计算机系，曾任谷歌总部科学家。

截至2017年4月，出门问问共完成六轮融资，总额超2.55亿美元，投资方包括红杉资本、真格基金、谷歌、大众汽车等。

2021年6月，出门问问推出大模型UCLAI，效果不佳。2022年10月，出门问问重拾大模型的研发。李志飞坦陈，研发过程压力很大，因为研发很烧钱，而且不知道最终结果如何，直到两三周前的一天才发现“序列猴子”的表现不错。

据李志飞介绍，“序列猴子”这个名字的灵感，来源于数学家埃米尔·波雷尔在20世纪初提出了“无限猴子”定理，即只要给予无限时间，一只猴子几乎必然能够打出任何文字，比如莎士比亚的《哈姆雷特》，而如果喂给机器猴子海量的文本序列，通过大规模算力去训练它，就能练就有智能的“序列猴子”，而大模型是一个序列模型。目前，“序列猴子”大模型主要是文本形式，未来则会向多模态的方向发展。

C端方面，在发布会现场，出门问问团队进行了多轮Demo演示，比如，回答“湖南和湖北哪一个省会的人口更多？广东和新疆呢？”等问题，也从一众菜品中为不吃辣、喜欢吃虾的客人推荐了合理的菜品；而回答“天猫背后的公司的创始人本科毕业于哪个学校？”问题时，也能轻松输出马云本科毕业于浙江师范学院（现浙江师范大学）。

出门问问内测大模型“序列猴子”，CEO李志飞：我们不融资也能支撑研发

出门问问大模型现场Demo演示（图片来源：钛媒体App编辑拍摄）

不过，有些问题依然会出现和其他GPT大模型一样的反复胡诌、文生图对不上等情况，比如现场让“画一只赛博朋克风格的猫”，结果生成的是一位打扮好的二次元人物。李志飞提到，“序列猴子”大模型的语料也来自于互联网中，“我们需要不断调整它（大模型）的一些对话策略，各种各样的能力输出。”

李志飞指出，在中国做大模型的公司，不论是33分，还是50分以上，都不要焦虑，应该意识到现在的大模型不再像上一代的AI能力有限，它已具备基本的逻辑推理能力，每次都能给人惊喜， “序列猴子”大模型已经具备了一定的自然语言理解、知识、逻辑以及推理等能力。他强调，大模型的训练要循序渐进，不要一上来就搞“应试教育“，大模型的能力可能很快能提升到80分，但是要从80分做到90分以上，仍然会是非常难的事情。

而在B端，李志飞现场透露，“序列猴子”企业专属大模型已在首批汽车、教育、律所、金融、运营商、旅行、传媒、设计、智能硬件、医疗十大行业内测探索伙伴，企业方包括中国移动、中国工商银行、中国一汽红旗、春秋航空、VIPKID等。

李志飞强调，大模型商业化落地首先是创作者，然后是B端，然后才是C端。他透露，在创作者方面，出门问问提供付费服务，B端主要提供定制大模型服务，提供个性化答案，例如把功能嵌入至企业微信里面等。

当被问及中国大模型和美国距离多远时，李志飞认为是16个月。他解释称，2022年1月谷歌发布指令学习大模型FLAN，之后的2022年10月ChatGPT发布，2023年3月GPT-4发布。中国企业目前发布的一批大模型与FLAN水平相近，如此推算，中美大模型的差距为16个月——这与百度CEO李彦宏和搜狗创始人王小川说法都不一致，此前李彦宏认为文心一言和ChatGPT差距只有两个月，王小川认为国内和GPT-4有两、三年的差距。

李志飞称，目前大模型烧钱很厉害，算力是当前重要挑战之一。他提到，现在“序列猴子”模型比较大，没有做太多优化，所以显卡要求比较高，因此算力对于出门问问来说是一个现实的问题，他认为后面应该会慢慢的解决算力需求挑战。

李志飞向钛媒体App透露，现阶段出门问问不需要融资。据悉，自2017年至今的过去七年，出门问问没有公开过最新融资消息。

“我们2012年创业，其实我觉得出门问问已经到了一个阶段，我不需要靠去融资，然后又去烧钱，烧完钱以后又开始亏损，然后亏损了又进入了一个裁员优化，这是过去我们看到确实是无数个行业、无数公司经历的这么一个循环。现在对我来说，肯定不愿意去参与融资这种竞赛，我还是想理解模型本身变成一个可用的产品。目前这个阶段，我们是不融资的，我不需要外面的资本也能支撑这方面的投入。”
“钱从哪里来？我觉得是能用1/10的钱，干出比别人10倍好的事情，这个对我来说最有成就感。我早期认识OpenAI内部的人，人家根本就不优化成本了，因为现在他们要探索天花板了。所以对我来说，我更加care是我能不能够发挥我的才智，能跟别人做的不一样，真的就用1/10的钱能做出别人10倍、或者差不多10倍好的东西。”

李志飞强调，中国不会有下一个OpenAI，主要原因是中美创业环境不太一样，不太可能是去重复OpenAI这样的发展道路，国内大部分人还是在思考中国竞争太激烈、商业化如何竞争。

“中国版OpenAI不是我们的目标。我的初心就是要‘造大模型’，理解大模型，再把大模型用起来。”李志飞告诉钛媒体App。（本文首发钛媒体App，作者｜林志佳）