谷歌I/O 大会召开,关注模型小型化和AI 安全监管5 月11 日,一年一度的谷歌I/O 开发者大会召开,生成式AI 成为此次大会的重点,包括:新一代语言模型PaLM 2;AI 聊天机器人Bard;谷歌生成式AI 实验版搜索引擎;Workspace 对标微软Office 全家桶,让AI 写邮件、画图、制表、代写文稿;生成式AI 协作工具DuetAI 提供代码辅助和聊天辅助功能;推出基于NVIDIA H100 GPU 的A3新实例;通过构建评估工具、增加水印和元数据等方式检测AI 生成内容;安卓增加由生成式AI 驱动的信息回复、生成式AI 壁纸功能等。我们认为核心亮点在于两方面:
1)大模型小型化,移动端有望兴起:此次谷歌推出的新一代语言模型PaLM 2 分为四种规格,其中Gecko 非常轻量级,可在移动设备上工作,并且速度足够快,即便在离线情况下也能在设备上运行出色的交互式应用程序。我们认为大模型的小型化、本地化将会成为未来的重要产业趋势,一方面实现模型的成本降低,另一方面实现数据的隐私保护。未来大模型有望在移动端更多部署,从而促进产业向万物互联时代迈进。关注在移动终端方面具备AI 业务布局的企业如中科创达、虹软科技、当虹科技等。
2)AI 安全监管:为了识别出AI 生成内容,谷歌计划很快将水印、元数据及其他技术创新集成到最新的生成模型中。谷歌还训练了一个检测合成音频的分类器,准确率接近99%。我们认为随着生成式AI 的发展,如何判别内容的真伪将成为一个增量的新需求,关注AI 安全监管和内容判别类的公司美亚柏科等。
(资料图)
AI 虚拟人兴起,有望成为生成式AI 的重要应用场景近期,有关AI 虚拟人的相关事件关注度持续提升:1)AI 孙燕姿全网走红:在B 站上,AI 孙燕姿翻唱的林俊杰「她说」、周董「爱在西元前」、赵雷「成都」等等较为逼真,引发全网的关注。2)美国女网红用AI 分身交友,实现按分钟计费:根据新智元的报道,23 岁的女网红用GPT-4 复刻了一个自己后,已经周入7 万多美元。这位叫做Caryn Marjorie 的网红,根据自己2000 个小时的YouTube 视频,训练出了一个语音聊天机器人,AKA「虚拟女友」。
我们认为,近期网上对AI 虚拟人的关注度持续提升,也出现了一定程度上的产品和商业模式落地。AI 虚拟人将会成为未来AI 和元宇宙结合的直接应用,也将从根本上改变人与人之间的关系,提升全社会的生产效率,创造更大的应用价值。关注在AI 虚拟人方面有业务布局的算法和产品类企业如科大讯飞、万兴科技、拓尔思等。
向量数据库是大模型时代的刚需,前景广阔
4 月以来,全球多家向量数据库创业公司密集获得新一轮融资。其中,Pinecone 完成1 亿美元B 轮融资(投后估值7.5 亿美元),Weaviate完成5000 万美元B 轮融资,Chroma 获1800 万美元种子轮融资,Qdrant 获750 万美元种子融资。
向量数据库是一种专门用来存储、管理和查询向量数据的数据库,其相较于传统关系型数据库主要有两点不同:1)存储的是向量数据,即将图片、音频、文章等非结构化数据转换为向量的方式来存储,以便于计算机或者AI 模型直接理解。2)使用相似性查找,不同于传统数据库的查询结果是一个精确的结果,向量数据库会把输入的内容与底库中的数据做相似度匹配,从而找出近似匹配的结果。
得益于上述特性,向量数据库先前多被运用于以图搜图、推荐算法等领域,但随着生成式AI 的出现,其使用场景几何级拓宽,具体包括:
1)帮助用户管理私域数据,既可以是B 端垂直领域的专业知识,也可以是C 端用户的画像信息;2)为大模型提供记忆功能,典型应用如AutoGPT 就采用了OpenAI(模型)+ Pinecone(向量数据库)的模式。3)降低大模型的训练和推理成本,如将常见的问答存入向量数据库,对于相似的问题直接生成答案,减少推理需求。我们认为,生成式AI 的出现让向量数据库迎来killer app 时刻,随着各类基于大模型的上层应用出现,预计向量数据库的使用量将出现跨越式发展,有望复刻移动互联网时代MongoDB 的兴起。关注:星环科技、拓尔思、大华股份、达梦数据、太极股份、创意信息等。
建议关注
基础工具:普源精电-U、鼎阳科技、坤恒顺维、霍莱沃、概伦电子、华大九天。
智能汽车:德赛西威、中科创达、四维图新、道通科技、虹软科技、万集科技。
工业软件:宝信软件、中望软件、中控技术、赛意信息、能科科技、鼎捷软件。
数字能源:朗新科技、国能日新、南网科技、龙软科技、国网信通、远光软件。
人工智能:科大讯飞、海康威视、大华股份、奥普特、商汤-W、寒武纪。
网络安全:深信服、安恒信息、启明星辰、天融信、奇安信-U、信安世纪。
风险提示
1)疫情加剧降低企业信息化支出;2)财政与货币政策低于预期;3)供应链波动加大,影响 科技产业发展。