随着人工智能赛道的火热,监管方面的相关工作也在不断推进中。本文了四大批次备案境内深度学习算法及公司一览,供你参考。
2024年3月,人工智能赛道上,中美印欧等国家和地区在监管探索方面展现出不同策略。而在我国,随着一系列监管方案的出台,境内深度学习算法的备案工作也在有序推进。
梳理了网信办《境内深度合成服务算法备案清单》四份备案材料,统计一共涉及了326项算法备案,包括2023年6月、2023年8月、2024年1月、2024年2月的备案清单,以及后的3项补充备案。
一、哪个细分赛道的深度合成算法玩家多?卷?
在深度合成算法领域,几类算法因其广泛的应用和实用性而备受欢迎。这些算法包括文本生成算法、图像生成算法、语音生成算法、视频生成算法、数字人生成算法、代码生成算法以及音频生成算法。
1. 文本生成算法:主要用途包括智能对话、知识问答、文章写作、机器翻译等
智谱ChatGLM生成算法 (北京智谱华章科技有限公司)
百度PLATO大模型算法 (北京百度网讯科技有限公司)
小冰语言模型算法 (北京红棉小冰科技有限公司)
比如,智谱ChatGLM生成算法的准确性不亚于GPT3.5,集成了文生图、智能对话、数据分析等。测试下来,智谱的长文本解读功能真的强悍,支持不超过30M的PDF文件解读,准确率极高,期待开放更多doc等格式。但文生图、数据分析功能并不好用。举个例子,其中文生图的promote语句“不带眼镜”但生成的图像基本都带有眼镜、数据分析只能支持平均数、中文数等分析。
智谱并不是一个熟悉的AI公司,但其背后却是互联网资本。早在2023年的8月和9月,阿里巴巴旗下的蚂蚁集团与阿里云战投相继参与了对智谱AI的融资,分别投入了4.4亿元和12亿元,助力其B轮次的融资。这一轮融资还吸引了顺为、小米、红杉、高瓴、腾讯等众多投资方的加入,形成了豪华的投资阵容。
2. 图像生成算法:主要用途涵盖虚拟试衣、虚拟装修、虚拟形象、表情、图片编辑等
百度文生图内容生成算法(北京百度网讯科技有限公司)
商汤秒画内容生成算法(上海商汤智能科技有限公司)
商汤格物高精度重建算法(上海商汤智能科技有限公司)
本月商汤系的MiniMax刚获得阿里巴巴的领投,根据彭博社的消息,新一轮融资完成后,MiniMax的估值将超25亿美元(约合人民币180亿)。
MiniMax自主研发的AI聊天应用Glow允许用户亲手“塑造”出个性化的AI智能体,无论是理想的恋人还是亲密的朋友,用户都可以根据自己的喜好为其取名,并设定独特的人设、性格和爱好。通过与这些AI智能体的内容生成和用户反馈机制,用户可以进行自流畅的沟通交流。据媒体报道,Glow自上线以来仅短短4个月时间,用户数量便迅速逼近500万,展现出强大的市场潜力和用户吸引力。
3. 语音生成算法主要用途包括文本转语音、语音合成、歌声合成等
百度语音合成算法(北京百度网讯科技有限公司)
达摩院语音合成算法(阿里巴巴达摩院(杭州)科技有限公司)
讯飞语音合成算法(科大讯飞股份有限公司)
语音生成算法在文本转语音、语音合成和歌声合成等方面具有广泛应用,为语音交互和语音内容创作提供了可能。我使用多的是飞书妙记的语音转文字,相比onenote插件仅支持繁体字、腾讯会议的ai录屏等,飞书妙记的网页版非常方便、不容易断续且文本翻译质量非常高。
字节在剪映等视频剪辑软件中的变声、文字转语音等应用也非常使用且场景丰富。
4. 视频生成算法:主要用途包括虚拟数字人、视频换脸、视频风格转换等
百度数字人驱动算法(北京百度网讯科技有限公司)
商汤2D数字人合成算法(上海商汤智能科技有限公司)
腾讯云数字人形象合成算法(深圳市腾讯计算机系统有限公司)
腾讯云、火山引擎B端定制数字人的价格是6000+/个,但通用版其实基本免费,这类IP类的落地和使用也较多。应用场景比如说金融行业:银行、保险、证券等,证券分析师、保险代理人等触客一线的人士可以利用数字人进行沟通产出,我们公司已在使用。自媒体等ip产出也较多,例如财经类大V等视频其实并不是本人,而是MCN机构量产的数字人。
5. 代码生成算法:主要用途包括代码自动生成、代码翻译等
商汤AI代码生成算法(上海商汤智能科技有限公司)
商汤AI代码生成算法-1(上海商汤智能科技有限公司)
我们公司已在推广使用代码助手,看了一眼推特上STEVENHONG利用AI发布的代码问答非常,理解后续能解放双手、释放效率也非常棒。
6. 音频生成算法:主要用途包括语音合成、歌声合成等
快音音色提取和歌声合成算法(成都开心音符科技有限公司)
小冰歌声合成服务算法(北京红棉小冰科技有限公司)
唱鸭文字生成音乐算法(广州欢城文化传媒有限公司)
二、主要玩家是哪些?
就备案数量而言,深度合成算法领域,国内的主要玩家包括北京百度网讯科技有限公司、上海商汤智能科技有限公司和北京红棉小冰科技有限公司。
北京百度网讯科技有限公司以19次的出现次数高居bangshou,显示了其在深度合成算法领域的广泛布局和强大实力。百度在文本生成、图像生成、语音生成、视频生成、数字人生成等多个领域均有突出的算法表现,如百度PLATO大模型算法、百度文生图内容生成算法、百度语音合成算法以及百度数字人驱动算法等。
上海商汤智能科技有限公司以12次的出现次数紧随其后,其在图像生成、代码生成等领域拥有强大的技术实力。商汤的秒画内容生成算法、格物高精度重建算法以及AI代码生成算法等,都展现了其在深度合成算法领域的创新能力和应用潜力。
北京红棉小冰科技有限公司以7次的出现次数位列第三,其在语言模型、数字人生成和音频生成等领域有着不俗的表现。小冰语言模型算法、数字人合成算法以及歌声合成服务算法等,都体现了小冰在人工智能领域的深厚积累和独特优势。红棉小冰前身为微软(亚洲)互联网工程院人工智能小冰团队,是微软全球大的人工智能独立产品研发团队,该团队于2013年12月在中国组建。
三、批次到第四批次发生了哪些变化?
在2023年6月至2024年2月期间,深度合成服务算法备案清单展现出了明显的变化趋势。
备案数量呈现出持续增长的趋势。从2023年6月的41个备案算法,到2024年2月的255个,备案数量在短短几个月内实现了大幅提升。这反映出深度合成技术在我国的快速发展和广泛应用,也体现了监管部门对于该领域日益严格的监管要求。
各类算法的备案数量也呈现出不同的增长态势。文本生成类算法的增长尤为明显,从2023年6月的较低占比增长到2024年2月的超过50%。这表明文本生成技术在自然语言处理、智能问答、内容创作等领域的应用正在不断深化和拓展。图像生成、语音生成、视频生成、数字人生成、代码生成和音频生成等类型的算法也都有不同程度的增长,反映了深度合成技术在多个领域的全面发展。
后放链接《国家互联网信息办公室关于发布第四批深度合成服务算法备案信息的公告》
https://www.cac.gov.cn/2024-02/18/c_24332.htm