本报(chinatimes.net.cn)记者卢晓 北京报道
AIGC这股热风,让以模式识别起家、已经成立三十周年的老牌科技公司汉王科技在自今年1月末的七个交易日中走出了七连板,成为ChatGPT概念龙头股之一。它的股价在今年3月初还登上了40.24元的52周最高峰。
4月21日,汉王科技股价报收25.19元,跌7.76%,虽已经有所回调,但相较去年最后一个交易日的收盘价仍上涨约62%。
汉王科技在AIGC领域的想象空间是资本市场持续火热的重要原因。日前,汉王数字常务副总经理李云鹏接受了《华夏时报》记者采访,谈及汉王目前在AIGC领域的布局,以及对这一行业未来趋势的判断。
深耕行业数字化
记者从汉王科技方面了解到,目前其已承担了“复杂版面手写图文识别及理解关键技术研究”等3个国家科技创新2030-“新一代人工智能”重大项目的课题研究工作,在多模态文本图像识别、人机智能交互、语义理解、视频结构化等多种人工智能关键技术上拥有自主可控的底层核心技术,并基于以上AI技术在众多垂直领域开展数字化、智慧化创新应用。
李云鹏认为,汉王做AIGC跟互联网大厂有本质区别,“大厂资金多、实力雄厚,更多是做普适性、大而全的平台,汉王则是深耕自己擅长的、有用户基础的细分行业,比如档案、政法、医疗、教育等行业。”
以面向各地档案馆等机构的智慧档案为例,他告诉《华夏时报》记者,档案开放审核是困扰档案行业多年的业务痛点,是业界公认的一块硬骨头,困难在于档案馆的数据藏量非常大,而且每年还在不断增加。《政府信息公开条例》和《档案法》都明确规定了相关数据开放利用的具体要求,但如果都通过人工来完成这项工作,工作量之巨大,成本之高,周期之长,不可想象。
而自去年开始,汉王已经在档案开放审核中加入了新一代OCR(光学字符识别)以及NLP(自然语言处理)等AI技术,让这项工作的效率直接提升了4-5倍。
值得一提的是,相对老一代OCR技术会受到低分辨率、复杂版式、重度噪声干扰等因素影响,新一代OCR技术在识别准确率、对图像的适应度等方面都有质的飞跃,继而再通过NLP技术“像人一样去阅读每一份档案”。如果存在限制内容或敏感信息,就自动标注出来,并且辅助生成这份档案的开放审核意见。“这些已经全部都是机器在做了,以前低分辨率的档案和手写档案会被OCR自动判定为一个插图,现在文字识别正确率基本上可以做到95%以上。”李云鹏告诉记者。
相对OCR这个汉王的老本行,汉王在NLP领域的真正落地在2016年左右。“我们原先只是解决图像转文本的过程,但转完文本以后干什么?”李云鹏对记者说,档案的重点是对内容的应用,“除了简单的检索和内容复用之外,我们想是不是还可以通过语义理解技术构建知识图谱,这为用户提供了更加多元化、智慧化的档案利用方式。”
竞争门槛将提升
AIGC让许多个行业发生巨变,它面对的B端市场到底有多大?
以数字档案为例,李云鹏告诉记者,汉王科技曾根据全国各地每年招投标量等数据做过市场分析,数字档案市场每年的总金额规模大概在100亿—150亿元,年复合增长率在30%左右。
有业内人士在跟记者交流时认为,现在数字档案市场大部分工作还是在做翻拍、基础管理系统开发等基于信息化进行的基础性建设,门槛并不高。“全国估计得有近万家企业或实体参与其中。”
这一竞争格局与数字档案行业当前所处的发展阶段不无关系。不过李云鹏认为,经过多年建设,我国档案数字化的基础性建设目前已处于收尾阶段,而增量市场则在于后续的智慧化应用。“场馆建得再漂亮,设备买的再多,那都是表面功夫,真正的智慧化需要把内容充分挖掘和利用起来。”李云鹏说。而要真正把内容利用起来,就得利用人工智能,就得利用大数据技术,“这个时候业务门槛就出来了。”
他告诉记者,为了抢占客户,汉王也会做一些数字化基础性的业务,但针对内容的挖掘和利用,才是汉王未来要做的重点工作。“我觉得越往后端走,类似于汉王这样具备核心技术能力的公司会更有机会一些。”
对于AIGC的未来商业模式,他认为,AI目前在各个行业的作用还是降本增效,它可以代替人工的大部分工作,但要想真正解决所有问题,还是需要有人来参与,“因此我判断未来整个市场大概率都要往采购AI加服务的方向走。”
他举例称,此前客户习惯一次性花钱采购汉王的软件,后续工作由自己来做。但是AI技术发展非常迅速,除了学习和实施成本,客户还面临因技术落后需要重复采购的可能。通过采购AI加服务,用户可以使用到最新的技术,同时节省下大量的人力成本,汉王科技则提高了自己的用户粘性,“我们采取背靠背的优质服务,不断的与用户交流,不断的挖掘AI能力在客户的哪些环节还能做点什么。”
处于商业化早期
不过,虽然AIGC让B端市场的商业空间充满想象,但是对汉王来说,C端才是它现在的第一大收入来源。
2022年财报显示, 汉王去年最大的收入来源是笔智能交互业务,约8.6亿元的收入占到汉王当期总收入的六成多。此外,去年收入约1.8亿元的AI终端也占到汉王总收入的13.3%。4月12日,汉王科技还一口气推出了了AI电纸学习本、掌静脉核验终端等五款C端新品。
作为对比,面对B端市场的文本大数据与服务约占汉王收入的16%,毛利率37.72%。此外,人脸及生物特征识别业务的收入占到汉王当期整体收入的5%。
对B端业务之于汉王的意义,李云鹏表示,整个汉王的定位就是深耕数字中国建设这个大赛道,而这其中B端市场和C端市场相辅相成,汉王拥有很多头部B端用户,对C端用户是一个很好的背书,同时伴随着在B端复杂场景中攻坚克难,汉王的技术提升同样可以反哺C端用户,提升用户体验。
这背后,以AI为代表的数字经济,已经成为我国经济的重要推动力之一。今年2月党中央、国务院印发的《数字中国建设整体布局规划》提出,建设数字中国是数字时代推进中国式现代化的重要引擎,是构筑国家竞争新优势的有力支撑。要推动数字技术和实体经济深度融合,在农业、工业、金融、教育、医疗、交通、能源等重点领域,加快数字技术创新应用。
不过需要提及的是,AIGC的商业化应用还处于市场早期。
汉王科技今年3月曾在回复深交所的问询函时称,其NLP技术及业务尚处于成长期,业务占比不高,随着行业发展阶段的变化以及更多实用性解决方案的落地推广,后续成长速度将会越来越快。
深度科技研究院院长张孝荣也对记者表示,AIGC目前还是弱人工智能阶段,要实现大规模商业化,有许多现实问题要解决,比如版权、监管和信息安全问题。“目前并没有合适的条件促使它快速商业化,只能走一步看一步。”
责任编辑:黄兴利 主编:寒丰