近日,海天瑞声正式登陆科创板,公司IPO共计发行新股1070万股,发行价格为36.94元/股。
招股书显示,本次发行募集资金扣除发行费用后,拟分别投向自主研发数据产品扩建、一体化数据处理技术支撑平台升级、研发中心升级建设和补充流动资金四个项目。公司表示,项目建成后,公司技术水平、业务规模、产品体系等方面都将得到显著完善。
海天瑞声是我国最早进入AI基础数据服务行业的企业之一,也是目前我国语音类数据资源市场份额最大的企业。自2005年成立以来,公司始终致力于为产业链上的各类机构提供算法模型开发训练所需的数据集,已成为我国领先的训练数据专业提供商。经过多年的业务实践与发展,海天瑞声目前与产业链上的各类机构建立了长期的战略合作关系,训练数据相关产品和服务获得了包括阿里巴巴、腾讯、百度、微软、三星、亚马逊、科大讯飞、字节跳动、中国科学院、清华大学等在内的众多大型优质客户的广泛认可,并应用于个人助手、智能音箱、语音导航、搜索服务、智能驾驶、机器翻译等多种产品相关的算法模型的训练过程中。公司在核心技术、行业经验以及专业服务能力等方面均处于行业领先地位,是具有国际竞争力、领先性的标杆企业,彰显了其在基础数据服务行业的影响力。
凭借多年的研发积累与持续创新,海天瑞声依托其100%自主研发的国产化技术体系、生产体系,自主开发了一体化数据处理平台,在基础研究、平台工具、训练数据生产三个维度均积累了核心技术,有机搭建起海天瑞声的训练数据开发一站式解决方案,提升了开发效率、服务质量及数据安全性,为下游客户提供了高质量的训练数据产品、高效率的训练数据定制服务及高水准的训练数据相关应用服务。
海天瑞声拥有对AI核心算法的理解能力、前瞻性的专业训练数据集设计能力、丰富的语言覆盖能力及场景采集能力,以及AI辅助标注及精细标注能力。公司已逐步建立起训练数据生产领域的技术壁垒和竞争优势,积累掌握了12项核心技术,广泛运用在训练数据生产的各个环节之中。海天瑞声目前已覆盖智能语音、计算机视觉、自然语言处理三大人工智能核心技术领域,产品和服务范围更是覆盖语音识别、语音合成、发音词典、图像与视频识别、手写体识别、光学字符识别、语义理解、机器翻译等多个技术方向。
经过多年积累,截至2020年12月31日,海天瑞声已拥有760余个自主知识产权的可授权使用训练数据产品,并向下游客户提供了累计超3600次/个训练数据定制服务或训练数据产品。这些产品和服务可覆盖生活交流、客服、家居、办公、行车、普通环境、噪声等多种特定场景中的语言现象和视觉呈现,构建成独具特色的训练数据集合,已应用于智能助理、智慧交通、智能搜索、智能家居、自动驾驶等16类应用领域,有效推动人工智能行业各类终端产品及应用的落地和优化,赋能人工智能技术与实体经济的深度融合。
公司表示,上市后,将继续聚焦训练数据领域,依托技术创新手段和系统开发能力,打造和提升高品质服务体系,强化数据资源优势,以高品质的产品服务响应AI产业落地与数字经济的主旋律,实现AI应用领域的新拓展。增强并探索数据驱动行业发展的能力,全面激发和带动基础数据服务的创新活力与高速发展。