专注软硬件开发,为您提供专业、高效、优质、贴心的服务! 邮箱:ytyunxinkeji@163.com

您所在位置:首页 > 新闻资讯 > 网易等多家算法原理公开,互联网行业如何应对挑战?

网易等多家算法原理公开,互联网行业如何应对挑战?

发布日期: 2022-08-31

  8月12日下午,根据《互联网信息服务算法推荐管理规定》,国家网信办公开发布了境内互联网信息服务算法名称及备案编号。

  

  相关企业使用的算法信息,均可通过互联网信息服务算法备案系统进行查询。

  

  根据清单显示,包括多个大型企业和产品的相关算法,比如网易、360、快手、微博、美团、优酷、百度、抖音、小米、天猫、淘宝、苏宁易购、富途牛牛、微信、腾讯等。

  

  在查询系统中,可以清楚的了解到每个平台的算法原理和运行机制、应用场景等信息。

  

  比如字节跳动公布了抖音的算法原理:基于系统收集的用户设备信息、位置信 息以及在使用产品时的行为信息(包括用户的点击、关注、收藏、搜索等),进行自动分析和计算,根据计算结果筛选出用户可能更感兴趣的内容进行推送。

  

  而运行机制主要是基于用户历史的点击、时长、点赞等行为数据,通过深度学习技术框架建立模型,预估用户对某个内容产生互动的概率,针对预估内容使用排序、打散、干预等机制和策略后,再向用户进行推荐。

  

  主要用于抖音短视频、今日头条、西瓜视频等产品的图文或 视频、商品及服务(广告)等内容的推荐。

  

  应用商店模式,几乎横扫了软件消费市场,让成千上万的精彩应用与游戏,无数开发者的脑洞与创意,可以与庞大的消费市场直接触达。

  

  到了智能时代,汇集了各类AI算法的算法市场也在过去几年间如雨后春笋般地涌现。华为云AI市场、百度AI市场、阿里算法模型市场等等,一众科技巨头悉数入局。针对计算机视觉、智能语音等垂直算法的创业平台,也屡见不鲜。

  

  在移动互联网时代,我们看到了无数开发者、互联网企业借助应用市场而声名鹊起、斩获成功的传奇。那么,开发者们将自己开发训练的AI算法模型放到这些平台上,能够再一次上演“造富神话”吗?

  

  必须承认的是,AI算法与移动互联网产品的逻辑并不相同,而这,是算法市场区别于应用市场的开始。

  

  1、AI,寻找know-how

  

  要说AI算法与移动应用最直观的区别,前者是一个需要不断演进的半完成品,后者则在上线时就需要以相对成熟的姿态来吸引终端用户。

  

  AI的可演进性,需要与其他软硬件设备来共同发挥作用、需要与垂直行业的业务细节来共同打磨成效,这些都直接导致了算法市场/开放平台更多是在做toB的买卖。

  

  对于开发者来说,买单者是那些希望购买现场的算法、或者有某种算法场景需求的企业型客户。这时候,除了算法本身的能力之外,是否需要底层硬件、终端设备的协同,定制化开发训练服务等等,也被涵盖其中。

  

  而另一方面,这些希望从算法市场找到解决方案的客户,之所以要以众创的方式来满足需求,也是因为项目规模小、业务场景碎片化、营销少,比如通过计算机视觉来识别仓库内吸烟行为、AI识别自家果林里的水果瑕疵等等,头部大厂无暇顾及这样的腰尾部客户,这让个人开发者及中小创业公司有了机会。

  

  如前所说,AI开发是一个需要深入到具体行业需求中去寻找know-how的工作,往往需要以软硬件排列组合、定制化场景开发、不断优化演进的方式为产业释放价值,这时候,算法市场所扮演的角色,就不仅仅是买卖平台那么简单了。

  

  2、2021,AI市场众生相

  

  发展到现在,算法市场主要有三种模式:

  

  第一是头部AI巨头所搭建的开放平台和AI市场,为开发者提供从底层芯片硬件、开发框架和工具、通用模型、专项数据集、开发者社区等等全栈支撑,并凭借品牌优势吸纳产业订单。这有点像是App Store、手机厂商的应用商店一样,能够给开发者提供形成一条完整的供需链,打造产业生态。

  

  第二种则是某一些垂直领域的AI公司,通过在本领域积累起足够的口碑、海量的数据、广泛的实践之后,从而有实力汇聚垂直行业的技术和算法,来满足本领域更多元、细分的用户需求。比如计算机视觉领域的一些平台,就像是游戏平台TapTap那样可以绕过手机硬件厂商的应用商店而打下一片江山。

  

  当然也不能忽略创业公司搭建的第三方算法市场,通过连接开发者、硬件厂商、行业客户,建立一个相对整合的综合供需平台,解决个人开发者品牌信任度不足、小微企业定制化开发成本高企等现实问题,加速达成交易。

  

  目前,知名的算法市场基本都提供了便利的基础设施和各种易上手的一站式服务,各种资源扶持如需求对接等也五花八门。这么多的平台也都在呼唤着开发者去参与创新、改变世界,那么,开发者究竟该去哪里赚钱?

  

  “零门槛也能开发AI”,几乎成了有实力的科技巨头吸引开发者的通用招牌。这种“普惠大放送”,近两年AI开发者的增长也开始出现了“内卷”的征兆。有数据显示,以软件为主的 IT 互联网领域, AI 开发者占比人数高达 80.1%。

  

  所以,找到需求并把它“做出来”已经不是什么难事,难的是顺利把算法模型“卖出去”。在争夺开发者的同时,算法市场也需要思考如何帮助开发者变现——总不能在算法模型里加广告吧。

  

  也正因如此,无论巨头羽翼下的AI市场,还是第三方开放平台,目前都还要戴着镣铐跳舞,去解决至少三个基本问题:

  

  1)如何保障市场中的算法质量。

  

  软件质量差、扣费陷阱多、盗版软件猖獗等等,都是曾经在应用商店中出现过的老问题,而算法时代对于平台的要求则更进一步,除了要经过严格审核、专业测评来保证算法质量以外,还需要在标准化和安全性上发力,以保证算法实际落地时能够兼容最多的硬件载体,不会窃取用户数据和隐私。

  

  但算法模型是一种不断演进的技术,对其加以审核、监管的难度可想而知,这也对平台的技术能力提出了严格要求。比如能否通过自动化的生产流程、提供数据处理推理等全程工具端管理等等,来帮助开发者提升效率、提高产品质量。

  

  2)如何让好的算法脱颖而出。

  

  不仅AI开发者的数量不断增长,在一些巨头搭建的算法市场中,往往也会出现官方算法和开发者算法混合售卖的情况,这时候,这时候中小开发者对接到服务商的机会就被稀释了。其实同样的故事在应用商店中就曾上演过,如果一款程序无法得到有效推广,那么就会在异常激烈的竞争中淹没,甚至滋生了刷下载、刷评论、刷星级等黑灰产。

  

  面对这样的情况,开发者们的积极性无疑会受到严重打击。平台自然不能袖手旁观,除了加大审核力度之外,更丰富多元的交易方式也十分关键,提供软件、硬件、软硬一体解决方案、定制化部署落地等等综合服务,有助于更多开发者有的放矢、打造出独特的竞争力,也让算法市场能够真正成为AI项目落地的桥梁。

  

  未来,拥有认证体系、交易保障的算法市场会加速形成品牌优势,让整体算法质量决定一个市场的成败。

  

  3)如何设计分利政策。

  

  算法市场的根本是让优秀的开发者获得商业成功,在初期,没有一个良好的盈利模式,保证开发者的收益,很难吸引开发者加入。那么,分利政策就十分关键。

  

  除了应用商店惯用的分成佣金模式之外,AI算法也根据交易方式而产生了直接交易(开发者与平台合作定制化算法)、解决方案等变现模式。

  

  但AI交易的一个矛盾在于,潜在购买者往往无法提出一个具体且清晰的技术产品需求,而是渴望找到一种能力、一种方法,对于这种模糊需求就需要大量的沟通、确认、匹配的工作,这时候,平台方、服务商、开发者往往处于一个既合作又博弈的关系当中,需要共同为购买者提供价值,又都需要牺牲一部分利益去教化用户。

  

  总的来说,一个成功的算法市场,必须拥有技术能力强、整体质量高、工具链完整、交易多元化、分利模式合理等特质,缺一不可。

  

  从这个角度看,目前各个算法市场还在探索连接供需双方的有效路径,距离“你死我活”、争夺开发者的较量还有距离。不过,风暴已经在酝酿。

  

  3、整顿算法推荐给平台方带来的挑战

  

  1)有限制的收集用户数据

  

  首先企业后面是不能再胡乱收集数据了,企业只能收集必要的数据,这些收集的数据是可以改善产品与服务的,跟企业提供的业务无关的数据是不可以收集的。

  

  2)将数据和服务的使用控制权交给用户

  

  未来用户是可以选择是否让企业收集自己的数据的,也可以先同意企业收集自己的数据,后面再要求关闭并且删除自己的所有数据。对于企业提供的算法推荐服务也是一样的,用户有权关闭企业提供的算法推荐服务。

  

  3) 企业会更难做精准营销了

  

  由于数据和服务的控制权都交给了用户,那么企业就更不容易收集到那么多的用户数据了。这对以数据为原料的机器学习算法是致命打击。没有了优质的海量数据,常用的机器算法就很难有用武之地(小样本学习、迁移学习等新方法未来可能会越来越重要),推荐没有那么精准了。如果用户关闭了算法推荐服务,那么服务将对该用户不可用。

  

  不过这个影响也没必要放大。我猜测国家法律是许可按照规范提供算法推荐服务的企业默认对用户开启算法推荐服务的。如果企业的提供的服务是公开透明的,让用户拥有控制权,并且真的能够为用户带来便利和好处,那么用户还是愿意使用的。真正关闭的用户可能比例不会那么大。

  

  4)企业必须投入专门的人力、财力去落实与法律管控相关的事务

  

  企业对数据的隐私保护,公开透明,这些都是要付出成本的。如果让用户拥有数据和算法推荐服务的控制权,这对产品形态,后端的服务,前端的交互展示逻辑等都有较大的调整,这无形中会涉及到很多部门的配合、开发、运营、维护等工作。

  

  为了满足法律管控、为了保护用户隐私、为了让用户有控制权、为了算法推荐的原理有更好的可解释性、为了服务更加公开透明、为了算法推荐的审核和备案、为了处理算法推荐的应急情况,这些对算法的工程架构,算法采用的技术方案等都有比较大的影响,甚至可能对公司组织架构都有影响,可能公司会成立专门的人员或者团队进行算法解释、新算法开发、安全审核相关的工作。这些改变,当然会涉及到人力、资源的投入。

  

  村上春树在《海边的卡夫卡》中写道:“暴风雨结束后,你不会记得自己是怎样活下来的,你甚至不确定暴风雨真的结束了。但有一件事是确定的:当你穿过了暴风雨,你早已不再是原来那个人。”AI、开发者和各行各业,都在等待鼎革天地又一宽后的风和日丽、群生灿烂。

  

  来源:钛媒体,快科技,数据与智能