首页 / 科技 / 商汤科技马堃:通用型人工智能将大幅提升生产力 元萝卜AI下棋机器人为家庭应用而生|WISE2023商业之王大会播报文章

商汤科技马堃:通用型人工智能将大幅提升生产力 元萝卜AI下棋机器人为家庭应用而生|WISE2023商业之王大会播报文章

11月28-29日,36氪WISE2023 商业之王大会在北京国际会议中心盛大举办。本届大会以“太阳照常升起 The Sun Always Rises”为主题,横跨一个主会场与六大垂直领域专场。主会场聚焦“未来3650天”、“在产业洪流中”、“进击中的万联网”、“AI与商业增量”、“全球品牌看中国”、“科技至上 共鉴创新”六大篇章重点议程,邀请全领域商业大咖展开为期两天的顶级商业对话,向现在提问,给未来答案。

在11月29日上午的WISE主会场演讲中,商汤科技联合创始人、西安电子科技大学客座教授、元罗卜智能科技有限公司总裁马堃为我们带来了《AI应用在家庭中的演进与探索》。

商汤科技联合创始人、西安电子科技大学客座教授、元罗卜智能科技有限公司总裁马堃

马堃认为,人工智能经历了符号智能、专业智能和通用智能三个阶段,当前正处于通用智能(AGI)的发展阶段,这将为生产力带来更大的提升。

商汤科技在人工智能领域投入了大量资源,以支持大模型研究和应用。马堃表示,商汤科技将大模型的能力应用在五个专业领域:商量(基于文字的聊天和代码生成)、秒画(文生图)、如影(数字人生成)、琼宇(3D大场景重建)和格物(3D小物品重建)。

在演讲中,马堃强调了人工智能产品应以人为本,为爱而生。他分享了商汤推出的一款AI下棋机器人,它可以帮助孩子们练习下棋,同时避免了长时间使用iPad等电子设备对眼睛造成伤害。一位用户留言表示,这款机器人让他有机会再次与已故的爷爷下棋,因为机器人记录了爷爷的下棋数据。这个故事让马堃和团队更加坚信人工智能产品应该为人服务,成为人与人之间情感的纽带。

以下是演讲实录,内容经36氪编辑:

各位嘉宾,大家好!

刚才王总说,他希望每个人都有一个数字分身,实际上我做了大概有二十多年的算法研究,一直在做人工智能。现在这两年人工智能越来越好,应用的越来越多,尤其是大模型。今年开始我感觉看每个人本身就是一个大模型,TA平时不停消化这些东西,再做一定地输出。

我是技术出身,很少去做演讲。这次也感谢36氪给我这样的机会,那么我基于商汤科技做过的一些人工智能应用和产品,给大家做一些分享和汇报。

刚才刘教授实际上已经介绍了,他把人工智能发展图谱分的很好,符号智能、专业智能和通用智能,这三个阶段我完全赞同。

我再补充一点,我理解的符号智能,就是专家系统类型。当时的研发和使用的规则,叫规则驱动,后面人工神经网络兴起,叫深度学习。还有现在的大模型,它们全都属于一种连接主义,是通过神经网络连接这种形式去做的。最大的一个范式更新叫做数据驱动,完全是从场景中间进来的数据。训练成为模型,再应用到整个场景中间去。

我发现任何一项技术的发展都是有周期的,就像刚才李洋总所说的,每天太阳要照常升起,但是任何一项新的技术,发展过程中总有大起大落。人工智能也是经历了极弱阶段,好在现在我们又看到了一个更大的新世界起来。而在新世界里,我们称之为通用人工智能,也叫做AGI通用人工智能。和以前不同的一点是更强调通用性。通用性实际上可能会带来生产力的更大的提升。此前的九年里,商汤做了各类人工智能专业模型去赋能各行各业,然后再去做应用,当时做的很辛苦,这些研究员不停记一个场景,就是要采集数据,去做各种各样的训练,而今天AGI提供了一种新的能力和思路,就相当于是用了更大的网络,可以存储更多的知识结构,让它用统一的模型,去赋能到各行各业里。

像刚才很多嘉宾和教授都已经介绍了,人工智能用了Transformer结构能够支撑这样的应用。根据前面五年来我们发现深度学习带来的改变,就可以感觉到未来会怎么样。前面五年大家感觉到最大的一个改变是什么?实际上是在5到10年前,没有人用过刷脸。而现在你看到处各种门禁,手机跟高铁到处都可见的刷脸应用,实际上也极大方便了大家的生活,提高了社会生产力,这就是一个很好的例子。我亲身经历过,所以说我相信后面的通用人工智能AGI到来之后,它以更高的速度和效率提升各行各业的生产率。尤其是到现在,会在GDP上也会有很强的提升。

高盛做过一些统计,大概在2030年,由于AGI带来的GDP的提升会有7万亿美元,而普华永道给的更乐观,可能在15亿之多。所以说这未来看起来很美好,导致今年在全国甚至全球都形成了训练大模型的热潮,人人都不想错过这班车,做出了各种各样的大模型。但是这也就形成了今天的所说的百模大战。

作为亲身参与其中的,我们自己能感受到,真正要做一个底层的有生产力的大模型,需要投入大量的资金和人力,像OpenAI为了去训练一次GPT4, 就要花6300万美金。商汤做了日日新大模型,使用上万块卡去做这件事情,所以说大模型能使用,实际上是要有很强的实力,才能做基础大模型的工作。

商汤目前的员工中超过一半的人都是属于研发人员,有在训练模型的,有在做实验模型的。商汤投入了超百亿的研发经费,去训练有自己的深度学习框架,有自己完整的深度学习工具链。同时在2020年的时候投了56个亿去做了亚洲最大计算中心之一的上海临港AIDC。

商汤发展到现在,两点幸运在里面:第一是选对路;第二是踩准点。

选对路是什么呢?实际上就是选择了一个基于计算机视觉的人工智能应用。商汤创始人基于二十多年的科研积累,着力于视觉的人工智能技术发展,最后在各行各业里都可以得到普遍的使用。

踩准点是哪一点呢?我这里举两个例子,很有意思,商汤的成立是在2014年,在座的我想看看有多少人那会儿知道深度学习,一定会很少,更别说想到后面的发展。而真正大部分人知道深度学习是在2016年谷歌的AlphaGo. 用深度学习战胜了世界顶尖棋手。但是在之前,商汤科技便成立,并进行了商业化运作。

还有一个点,2020年投资了56个亿做亚洲最大计算中心的AIDC。为什么大力投入到算力,到底有什么作用呢?实际上在2022年底,当OpenAI的ChatGPT出来了之后,大家就发现这个大模型的价值,以及要训大模型,没有大算力是根本做不到的。所以说商汤2023年就推出了日日新大模型,这个大模型可不是一天炼成的。

实际上,团队基于20年的学术积累和将近十年的产业积累,同时大模型很依赖人力、算法和算力,还有一些商业应用,这四个要素必须完整的结合,才有可能做出有影响力的基础大模型。

大模型实际上看不见摸不着,为了能充分发挥价值,商汤科技把它放在了五个专业的应用领域里。

这五个领域分别就是商量、秒画、如影、琼宇和格物,大家听起来都比较文艺范儿的一些词,还有一个开源的大模型叫“书生”,在这里也要强调,商汤是强调中国文化的。所以说完全用中国文化去命名自己的产品,就比较难记。我给大家用对标的方法大概解释一下就好记了。

商量实际上是对标ChatGPT, 它就是主打基于文字的聊天或者代码生成;

秒画是文生图产品,现在商汤有支持开源的模型和自研的模型;

如影是数字人生成;

琼宇是基于3D大场景的重建,而大场景就是可能几平方公里甚至几百平方公里的三维重建。

格物强调的是3D小物体重建,小到多少呢?小到可能你手上的首饰、手镯、耳环之类小物体的三维重建。

所以后面三项是针对于人、场、物的3D数字化重建。

这些都是基于商汤的日日新大模型体系。这些模型在很多公开评测上都取得了前列成绩。对我们自身业务相关的大模型已经有了六倍的增长。

我们人工智能的能力,不仅是自己用,也是对外赋能百业、赋能各行各业。比如说我们对电商媒体社区用服务的形式,把商量和秒画的能力输出,让大家对银行客服直播系统,把语音产品用数字人的形式进行输出。

除了这种服务,我们还有用芯片、传感器SDK去支持智能硬件。在智能硬件底层就具有了人工智能的能力。另一款模型叫大医,大医模型就是赋能智慧医疗。

最有趣的是去年开始,我们做了一个完全面向家庭的人工智能产品,叫做元萝卜AI下棋机器人。说到下棋,大家自然就知道AlphaGo。但是AlphaGo当年和李世石下的时候,它是靠人才赢的,怎么靠人呢?实际上是它的开发者充当了AlphaGo的手臂进行摆子和落子的操作。商汤现在做的AI下棋机器人,完全是全自动,不需要人干预。从摆棋、放子、收棋全自动完成。它的能耗功率只有不到30瓦。我们做这个机器人,就是想这些人工智能的东西要看得见,摸得着,而且要买得起,用得上。现在自动的机械臂的机器人,实际上很多博物馆也有,都是三五十万个,最终整个系统占一大堆。我们的机器人只占1平方米,只有2000到3000块钱,你就可以把它拿回家去体验人工智能给你生活带来的升级改变。

这后面有很多我们20年积累的图像处理算法、机械臂算法和强化学习的对应算法,才能做到目前这种形式。我们不是为了炫技,而是为了真正地使用和实用。

给大家看一下,上市了一年多,这是真实的用户买了之后的反馈。而他们的反馈实际上就是,很多小朋友家长想让小朋友去练习,但是又害怕长时间用iPad伤眼睛,那么怎么办呢?实际上下棋机器人就是沉浸式的真人体验,在实景棋盘上进行下棋,所以说不会伤眼。

家长想着小朋友如果学习了,到家里来,应该要经常练,但是家长不会练,或者没时间练,怎么办呢?实际上机器人就可以充当无时无刻地陪练。而且你调整各种级别,从业余20级到职业九段,都可以找到棋逢对手的陪练,帮你练,所以说我们机器人就是益智不伤眼、专注,有陪练,这个机器人在各大展会展出了之后,每一次都是全场的热点,得到了中央电视台各大频道的持续报道。这两年来,在双11的购物节上,我们在京东和天猫的家庭智能机器人品类连续保持领先。未来我们是把更多的人工智能的能力放到机器人上,包括自然语言交互和智能分析。

最后,我想用一分钟时间给大家念一段真实用户的来信。

他说:“您好,希望您能有几分钟看一下这条信息。我爷爷很喜欢下棋,我去年送给了他这个机器人,陪他下棋,可惜他今年去世了,我再也不能和爷爷下棋了。但是他的下棋数据被记录在这个机器人里面。我希望贵公司能出一个功能,能根据过往数据能生成智能棋手来对战,能让我再和爷爷下上几盘棋。”

这是一个很感人的真实故事。我觉得我们做了这个产品,真是很自豪和欣慰。有些人说要防范人工智能发展,我们觉得实际上这样的人工智能产品,更多的是可以为人服务,比如我们的这款元萝卜AI下棋机器人,就可以充当这个人和爷爷之间的联系纽带。这个用户的来信给了我们未来去做人工智能产品更强的信心和决心,而且坚定了我们对人工智能产品的理念。

我们认为人工智能的产品一定是“以人为本,为爱而生”。

谢谢大家!

本文来自网络,不代表今日新闻立场,转载请注明出处:https://www.newstoday.cc/2bE49wL.html
上一篇
下一篇

为您推荐

返回顶部