【资料图】
近日,海天瑞声CEO王晓东受邀出席2023年中关村论坛,并发表了题为《共享开放数据助力数字中国建设》的演讲,宣布海天瑞声将开放多模态数据集。
王晓东表示,作为AI数据行业里首家上市公司,海天瑞声天然肩负着开源开放、推进数据资源整合共享的社会责任。开源数据集可以帮助各领域的研究者和开发者快速获得更多高质数据样本,进而提高模型的精准度和鲁棒性,帮助他们更好地进行算法研究和模型训练。此次即将开源的多模态数据集「DOTS-MM-0526」涵盖图像、语音、文本等多个维度。海天瑞声希冀与全球AI开发者和研究人员建立更加紧密的合作关系,共同推动人工智能技术的发展和应用。同时,开源数据集计划亦是公司对于AI开放生态的一次有益尝试,是公司在数据智能化应用领域持续发力的体现。
会上,王晓东还发布了海天瑞声企业品牌焕新战略:公司将启用全新Logo,英文名称将从“SpeechOcean”改成“DataOcean AI”,中文名“海天瑞声”不变。
王晓东表示,“此次品牌升级不仅是一个简单的改名,它还代表着海天瑞声将在数据科技和人工智能领域的进一步发展和探索。”
他进一步阐述道,海天瑞声因优质海量的智能语音数据被大家所熟知,但近些年来随着人工智能技术的不断迭代与发展,海天瑞声的业务已从单纯的语音领域服务,扩展至提供覆盖语音、计算机视觉、自然语言处理和多模态的数据解决方案及成品数据集,未来还将支持以数据驱动的生成式AI业务发展。显然海天瑞声早已不再局限于“语音Speech”而是更广阔的“数据Data”海洋。为更好地反映公司的业务范围和技术实力,海天瑞声对企业品牌进行了升级,以更好地满足客户全方位需求。
而品牌升级背后,海天瑞声全新的战略布局也逐渐清晰呈现。据了解,自2005年成立以来,海天瑞声就一直在为AI产业链上的各类机构提供AI算法模型开发训练所需的专业数据集。目前这些数据集已覆盖智能语音、计算机视觉、自然语言等AI核心领域,并在自动驾驶、虚拟主播、声纹识别、人脸姿态等众多人工智能场景及相关算法模型的训练过程中获得应用。