日前,多家互联网大厂的30条算法机制按照《互联网信息服务算法推荐管理规定》(以下简称《规定》),在互联网信息服务算法备案系统(以下简称“系统”)完成备案。国家互联网信息办公室(以下简称“网信办”)表示,新的备案信息还将持续更新。
这是《规定》自2022年3月1日正式实施以来,网信办集中公布完成算法备案的互联网企业产品信息。《规定》第二十四条明确要求,具有舆论属性或者社会动员能力的算法推荐服务提供者应当在提供服务之日起十个工作日内通过互联网信息服务算法备案系统填报服务提供者的名称、服务形式、应用领域、算法类型、算法自评估报告、拟公示内容等信息,履行备案手续。
4月8日,网信办下发《关于开展“清朗·2022年算法综合治理”专项行动的通知》,网信办将牵头会同相关部门成立联合检查组,对部分互联网企业进行现场检查。地方网信部门也将对属地其他企业开展检查。检查的重点是企业算法合规情况和算法安全能力。
此次完成算法公示的产品涉及多家互联网大厂,包括网易、百度、阿里巴巴、美团、微博、快手、腾讯、字节跳动、小米等。从产品类型上看,此次备案算法的产品中,APP37个,网站11个,小程序4个,APP和网站占有较高的比例。
从算法类型上看,个性化推送类算法备案多,为17个;检索过滤类算法4个;排序精选类算法4个;调度决策类算法3个;生成合成类算法2个。
此次备案的算法基本上覆盖了互联网大厂的主流产品,如美团、美团骑手、百度搜索、抖音、头条、微博、微信、腾讯新闻、手机天猫、手机淘宝、菜鸟、钉钉等产品的算法。
随着备案工作完成,一些带有互联网基础设施性质的应用产品运行逻辑揭开神秘面纱。微博热搜算法的备案信息披露,微博热搜的热度计算公式为(搜索热度+讨论热度+传播热度)*互动系数。互动系数由互动率产生,指用户在热搜结果页下转评赞等互动行为的比率,反映用户消费内容的意愿。
百度热搜的运行机制是从全网范围挖掘热点事件,以事件粒度将热点事件的资源进行聚合,筛选优质内容,将热点事件的资源形成结构化的事件描述和对应的待审核热词提供给运营编辑进行审核与修改生成优质的热词,根据热词的热度值进行排序,将排序结果在榜单中展示给用户。
百度搜索功能的算法逻辑是从相关性、时效性、性、页面质量等维度在网页候选库里找到更匹配用户搜索需求的检索结果集合,将检索结果返回,并在百度搜索结果页向用户进行排序展示,优化并提升用户的信息检索需求满足度。
一位算法领域的人士告诉《中国经营报》记者,算力作为信息基础设施的重要组成部分,降低算力门槛、充分挖掘数据价值是业界关注的焦点。开放算法模型就是让算力使用更简单的重要方式之一。
备案的算法对于较受关注和诟病的“信息茧房”问题做出了部分回应。抖音在备案算法中明确,为了避免“信息茧房”问题的出现,抖音个性化推荐算法专门设计了“兴趣探索”机制。一方面,每次推荐都会选择用户过去不常观看的内容类目进行一定比例的推荐。另一方面,每次获取推荐内容的过程中会特别增加一条随机内容来保障用户可见内容的多样性。
这一算法被应用于主要用于抖音短视频、头条、西瓜视频等产品的图文或视频、商品及服务(广告)等内容的推荐。
优酷在备案算法中明确,个性化推送类算法会基于模型预测人群偏好特征,匹配人群可
能感兴趣的视听内容、服务或其他信息,对展示的视听、服务或其他信息进行排序。优酷会根据用户使用产品过程中的浏览行为,对推送模型进行实时反馈,不断调整优化推送结果。为满足多元需求,优酷会在排序过程中引入多样性打散机制,拓展推送的内容,避免同类型内容过度集中。如用户想管理优酷为其推送的个性化内容,可以在“我的—设置—
其他设置”中进行设置。
《规定》第十七条明确要求,算法推荐服务提供者应当向用户提供不针对其个人特征的选项,或者向用户提供便捷的关闭算法推荐服务的选项。用户选择关闭算法推荐服务的,算法推荐服务提供者应当立即停止提供相关服务。
美团在备案算法中披露了订单分配的算法运行机制。在保持骑手合理劳动强度的前提下,订单分配主要考虑骑手的时间宽裕程度和顺路程度,基于订单详情、区域供需等信息通过机器学习模型得出预估的到达时间;还设置三层保护时间:城市特性保护时间、分段保护时间、分距离保护时间,分别对应不同城市地理通行及交通特性,商家出餐、骑手到店、骑手骑行、用户小区交付时间,不同配送距离等个性化场景和情况。
一位平台经济领域的律师告诉记者,算法或许是平台经济下一个重点规范的领域。过去大部分算法的运行处于“黑箱”之中,规则和标准并不透明。算法备案制度有利于平台企业更加审慎克制地使用算法,算法的公开透明,也对行业技术的突破有积极作用。