≈≈海天瑞声688787≈≈维赛特财经www.vsatsh.cn(更新:24.10.30)
[2024-10-30] 海天瑞声(688787):AI应用需求带动公司业绩增长-2024Q3业绩点评
    ■东北证券
    整体业绩恢复情况良好,Q3收入保持高增。公司2024年前三季度收入1.50亿元(YoY+44.90%);归母净利润378.87万元(YoY+111.80%);单三季度来看,公司营业收入为5713万元(YoY+98.69%),归母净利润337.23万元(YoY+122.7%)。整体来看,随着海外市场的逐步恢复以及国内AI数据需求的增长,公司整体业绩仍处于快速恢复阶段。
    随着AI大模型训练的深化,数据服务商行业开始壁垒增长、附加值提高、集中度提高。(1)预训练阶段,客户需要数据服务商提供大量的原始数据;(2)强化学习阶段,大模型的对齐需要数据服务商提供调优、反馈等服务;(3)应用阶段,企业需要针对自身业务特点和需求训练专用的小模型,需要数据服务商提供专业化、全流程数据服务。数据服务商在根据不同行业和企业要求进行改造,并提供需求数据的同时,还会基于行业理解,与企业共同制定相关的标注规范和规则,从而让算法发挥出更高的识别效率。此外,随着公司深度参与到客户人工智能算法从预研立项、定制开发到部署投放的全过程中,有望持续提高自身的数据服务能力,在不同阶段为客户提供自制数据集,定制化的数据采集、数据清洗和数据标注服务以及数据中台集成能力。我们认为,随着行业飞轮效应的逐步体现,数据服务商行业集中度和应用范围将进一步提高,行业领先企业将更受益于行业的发展。
    海天瑞声是国内AI数据服务的领先企业。公司深耕数据服务行业20年,从做智能语音领域的数据服务起家,公司主要业务是AI训练数据的研发设计、生产及销售业务。技术能力方面和场景资源方面,公司在基础研究、平台工具、训练数据生产方面均有技术积累,并公司持续在智能语音、计算机视觉、自然语言、以及智能驾驶为代表的垂直领域进行技术拓展;软实力方面,公司拥有较强的项目管理能力和全流程的数据服务能力。这些优势有望使得公司在行业的竞争中进一步脱颖而出,进一步享受行业发展红利。
    盈利预测:由于目前AI应用还处于爆发初期,目前订单释放节奏较慢,我们下调公司2024-2026年营业收入分别为2.16/2.89/3.70亿元,归母净利润分别为-0.16/0.02/0.12亿元。公司所处赛道目前处于赛道正在大爆发早期阶段,应更关注公司收入及订单的增长而非利润,维持"买入"评级。
    风险提示:全球AI行业发展不及预期,海外业务拓展不及预期,国家数据标注基地建设不及预期,估值模型与盈利预测不及预期

[2024-06-02] 海天瑞声(688787):数据标注基地建设拉动国内市场新需求-事件点评
    ■东北证券
    事件:国家数据局党组书记、局长刘烈宏在第七届数字中国峰会主论坛上发布了承担数据标注基地建设任务的城市名单。此次共有七个城市入选,它们分别是:四川省成都市、辽宁省沈阳市、安徽省合肥市、湖南省长沙市、海南省海口市、河北省保定市、山西省大同市。
    新一代数据标注成为是大模型高质量发展重要一环,行业壁垒正在逐步提升。在大模型时代,AI开发以数据为核心,其发展速度迅猛。数据的多寡与质量直接关系到大模型的智能水平。对于大模型的数据标注,包括预训练数据、指令微调、提示工程和人类反馈强化学习等任务,这些任务不仅技术含量高,知识密集,而且具有很高的价值。数据标注工作需要更多的专业知识和技能,如领域知识、数据理解和分析能力等,数据标注从业者将出现高学历背景和多学科融合的特点。不再是简单的劳动密集型工作。
    国家级数据标注基地的建设将显著提升数据标注行业的地位和影响力。当前,大模型训练中高质量的中文语料资源相对不足。为了确保我国人工智能技术的可控性和可持续发展,必须构建一个有利于中文语境表达和产业应用的大模型预训练语料库。作为国家级别的项目,政策上的大力支持和资源上的优先配置,将为数据标注行业的发展提供有力保障。同时,这也将引发社会对数据标注行业的更多关注和认可,提高行业的整体形象和地位,同时也会释放出大量的相关订单。
    海外AI需求持续提升,带动海外数据标注需求上行。目前全球领先的大模型数据标注企业主要分布在北美,突出的特点是技术驱动导向,数据标注服务供给能力和质量较高,如ScaleAI估值达130亿美金,2023年营收超过7.6亿美元(ARR)。ScaleAI的竞争优势来自标注算法迭代后的规模经济效益,既有效率又有质量。海天瑞声也在不断完善算法技术,提高人机交互的数据处理效率及实现规模化效应,并将建立一个海外技术研发体系,紧跟全球AI的发展动态,积极开发与海外新兴技术相适应的AI数据解决方案,以不断增强公司在国际市场的竞争力盈利预测:预计公司2024-2026年营业收入分别为2.62/3.93/5.03亿元,归母净利润分别为-0.17/0.02/0.15亿元。公司所处赛道目前处于赛道正在大爆发早期阶段,应更关注公司收入及订单的增长而非利润,因此首次覆盖,给予"买入"评级。
    风险提示:全球AI行业发展不及预期,海外业务拓展不及预期,国家数据标注基地建设不及预期,估值模型与盈利预测不及预期

[2024-05-06] 海天瑞声(688787):业绩短期承压,有望受益于AIGC长期发展-2023年报及2024年一季报点评
    ■华创证券
    事项:
    公司发布2023年年报和2024年一季报。2023年实现营收1.7亿元,同比下降35.33%;实现归母净利润-0.30亿元,去年同期实现盈利0.29亿元;实现扣非净利润-0.43亿元,去年同期实现盈利0.10亿元。2024年Q1公司实现营收0.41亿元,同比增长41.04%;实现归母净利润-63.41万元,同比增长95.34%;实现扣非净利润-264.63万元,同比增长84.48%。
    评论:
    业绩短期承压,一季度营收明显提升。2023年公司业绩承压,实现营收1.7亿元,同比下降35.33%,主要系境内外受公司内部周期性调整及相关法规落地实施的阶段性影响导致客户预算释放进度放缓所致。2024年Q1,公司实现营业收入0.41亿元,同比增长41.04%,主要系大模型技术不断发展、以多语言智能语音、文本为代表的数据需求快速增加所致。
    费用率提高,一季度毛利率大幅提升。2023年公司实现毛利率56.01%,同比下降8.72pcts。整体费用率86.08%,同比提高21.87pcts。销售/管理/研发费用率分别为14.01%/37.76%/34.40%,同比变动+7.03/+14.40/-1.46pcts。2024年一季度公司实现毛利率71.92%,同比提高24.13pcts,主要系公司数据集产品收入占比大幅提升,驱动公司整体毛利率增加所致;实现整体费用率76.80%,同比降低53.87pcts;销售/管理/研发费用率分别为12.30%/32.06%/32.33%,同比变动-4.60/-22.08/-26.43pcts。一季度经营活动产生的现金流量净额为498.59万元,较去年同期增加2,767.03万元,主要受益于2024年Q1公司收入同比增长显著,同时公司进行了管理资源的合理配置和流程优化。
    持续推进大模型开发,深化AIGC研究进程。公司始终致力于为AI产业链各类机构提供算法模型发开训练所需的专业数据集,自有知识产权的训练数据产品储备超过1,550个,全面覆盖智能语音、计算机视觉、自然语言等多条业务线,全面服务于人机交互、智能家居、智能驾驶、智能金融、智能安防等多种创新应用场景,目前客户累计数量超过930家。未来,公司将继续秉承技术+产品双轮驱动的核心理念,重点服务以大模型为主的新兴技术方向的数据需求,加强技术能力护城河,不断向训练数据生产智能化、规模化方向迈进。
    投资建议:公司作为人工智能训练数据服务企业,AI浪潮有望为公司带来业绩增量。考虑到宏观经济变化以及业绩释放节奏,我们调整盈利预测,预计2024-2026年公司营收分别为2.14、2.72、3.48亿元,对应增速分别为25.8%、27.3%、27.8%;归母净利润分别为0.3亿元、0.7亿元、0.9亿元,对应增速分别为200%、130%、29%,对应EPS分别为0.5元、1.16元、1.50元,维持"推荐"评级。
    风险提示:核心产品迭代速度不及预期风险,AI行业发展不及预期,行业竞争加剧。

[2023-05-09] 海天瑞声(688787):境外数据训练和智驾数据业务实现高增,多因素驱动数据服务高景气度-2022年报和2023年一季报点评
    ■华创证券
    事项:
    4月25日,公司发布2022年报和2023年一季报,2022年实现营业收入2.63亿元,同比增长27.32%;归母净利润0.29亿元,同比减少6.81%;归母扣非净利润0.10亿元,同比减少51.83%。2023年一季度实现营业收入0.29亿元,同比减少39.81%;归母净利润-0.14元,同比由盈转亏;归母扣非净利润-0.17亿元,同比由盈转亏。评论:
    营收稳步增长,境外数据训练和智驾数据业务实现翻倍增长。2022年,公司营收实现稳健增长,主要系受益于公司全球化战略得以恢复实施,以及公司智能驾驶数据业务取得显著成效。训练数据全球化业务,2022年,境外企业多语种多模态数据业务需求呈现快速增长趋势,公司境外业务收入达到1.16亿元,同比增长102.04%。智能驾驶数据服务业务,得益于智能驾驶级别以及渗透率的不断提升,智能驾驶相关数据需求呈现出规模化增长趋势。2022年,公司智能驾驶业务收入4174.51万元,同比增长115.12%,客户数量超过50家,覆盖传统车企、新势力车企、智能驾驶技术公司等。
    投入加大带动费用率有所提升。毛利率端,2022年公司毛利率为64.73%,同比+0.72pct。费用率端,公司销售费用率/管理费用率/研发费用率yoy-0.04%/+6.30%/+6.55%,主要系公司持续加大研发投入,同时完成管理架构及激励体系升级、全球化营销体系建设、新办公楼购置等重要事项,共同造成期间费用率大幅增长。2022年公司经营活动产生的现金流量净额为3,065.89万元,较上年同期增长4,620.72万元。主要系公司收入同比增长+加强回款考核力度所致。
    多重因素驱动数据服务高景气度,公司有望充分受益。大模型、数据要素、数据安全、智能驾驶等多重因素驱动数据服务行业需求高景气度,公司作为国内最早从事训练数据综合服务企业,在平台、算法、多语种覆盖、产品等多方面具备较强的能力和优势。公司将继续重点夯实全球化业务和智能驾驶业务,积极探索数据要素和大模型等带来的新机遇。
    投资建议:公司作为人工智能训练数据服务企业,AI浪潮有望为公司带来业绩增量。考虑业绩释放节奏,我们预计2023-2025年公司营收分别为3.46亿元、4.44亿元、5.69亿元(2023、2024年前值为3.52、4.47亿元),对应增速分别为31.7%、28.2%、28.3%;归母净利润分别为0.51亿元、0.75亿元、1.03亿元(2023、2024年前值为0.50、0.68亿元),对应增速分别为72.3%、47.2%、38.4%,对应EPS分别为1.19元、1.75元、2.42元,维持"推荐"评级。
    风险提示:核心产品迭代速度不及预期风险,AI行业发展不及预期,行业竞争加剧。

[2023-04-24] 海天瑞声(688787):海天瑞声2022年营收同比增长27.32% 拟10转4派6元
    ■上海证券报
  海天瑞声发布年报。2022年实现营收2.63亿元,同比增长27.32%;归属于上市公司股东的净利润2945.41万元,同比下降6.81%。基本每股收益0.69元。公司拟每10股派发现金股利6元(含税),同时以资本公积向全体股东每10股转增4股。
     公司同日发布一季报。2023年一季度亏损1361.63万元。

[2023-01-04] 海天瑞声(688787):国内AI训练数据龙头提供商,自动驾驶业务打开成长空间-深度点评
    ■浙商证券
    公司是国内领先的人工智能数据标注提供商,提供AI算法模型开发所需的专业数据集,业务覆盖智能语音、计算机视觉、自然语言等场景,并积极布局自动驾驶业务,未来有望打开公司成长空间。公司产品服务在人机交互、智能家居、智慧城市等领域均有深度应用,对标海外龙头ScaleAI和Appen,我们认为公司有望充分受益于数据要素生态构建和人工智能产业加速发展,并且在自动驾驶新业务加持下,实现业务的快速增长。
    AI进入数据智能时代,质量+规模拉动数据标注需求快速成长人工智能行业持续成长,模型复杂度和算力提升拉动了训练数据需求量的加速提升,根据Congnilytica预测,到2027年全球AI训练数据市场需求将达到220亿美元,而观研天下数据中心预测到2029年,我国数据标注行业市场规模将达到204.3亿元。数据规模以及质量需求升高将拉动数据标注行业的快速成长。
    自动驾驶渗透率提升,公司智能驾驶数据业务有望迎来爆发公司积极布局自动驾驶相关业务,于2022年6月上线第三代智能驾驶标注平台并发力研发第四代产品,截至2022年第三季度,公司已验收订单以及在手订单合计约5000万元,同比增长超200%。我们认为随着自动驾驶渗透率提升,叠加技术向L3及以上级别发展,数据标注需求将快速成长,公司已设立独立的自动驾驶事业部并配置专项研发、销售、产品和项目交付团队,未来相关业务有望实现高速增长。
    持续布局语音语义赛道,多语种为公司核心技术壁垒公司基于多年语音识别及合成领域的技术积累,在多语种领域构筑深厚技术壁垒。截至2022H1公司拥有190个语种/方言的覆盖能力,累积词条数超过1000万。公司持续布局海外市场,2022年H1境外收入占总收入达57.14%,境外市场签单额同比增长近2.5倍,前三季度境外基础训练数据业务收入同比增长近140%。我们认为随着公司海外业务的加速布局,能够更好地发挥公司在语音和自然语言领域的多语种优势,打开公司广阔成长空间。
    盈利预测与估值我们预计公司2022-2024年实现营业收入分别为2.67/4.00/5.48亿元,同比增长分别为29.36%/49.67%/对应归母净利润分别为0.14/0.45/1.02亿元,同比增速分别为-56.75%/230.52%/126.32%,对应EPS为0.32/1.06/2.39元,对应PE分别为205.04/62.04/27.41倍。首次覆盖予以"买入"评级。
    风险提示1、技术迭代风险2、汇率波动风险3、新客户拓展不及预期带来的风险;4、市场竞争加剧风险;

[2022-11-05] 海天瑞声(688787):自动驾驶刚需,稀缺的AI数据标注"智能工厂"
    ■天风证券
    海天瑞声:国内领先的AI训练数据专业提供商。公司致力于为AI产业链上的各类机构提供算法模型开发训练所需的专业数据集。公司所提供的训练数据覆盖智能语音(语音识别、语音合成等)、计算机视觉、自然语言等多个核心领域,全面服务于人机交互、自动驾驶、智能家居、智慧城市等多种创新应用场景。其中智能语音为公司的优势领域,产品线已包含190个主要语种及方言。公司的产品和服务已获得字节跳动、阿里巴巴、腾讯、百度、科大讯飞、海康威视、微软、亚马逊、三星、中国科学院、清华大学等国内外客户的认可,应用于其研发的个人助手、智能音箱、语音导航、搜索服务、短视频、虚拟人、自动驾驶、机器翻译等多种产品相关的算法模型训练过程中。公司客户累计数量740家,覆盖了科技互联网、社交、IoT、自动驾驶、智慧金融等领域的主流企业,教育科研机构以及部分政企机构。自动驾驶或将加速落地,公司有望迎来首个行业级数据业务高增长。根据IDC发布的《中国自动驾驶汽车市场数据追踪报告》,2022年一季度L2级自动驾驶在乘用车市场的新车渗透率达23.2%,整个市场处于L2向L3+级别发展的阶段。随着激光雷达的铺货、成本的降低以及自动驾驶相关政策性文件的推出或将加速L3+级别自动驾驶的落地。自动驾驶技术的迭代需    依赖大量的数据进行训练,数据贯穿研发、测试、量产、运营维护等全生命周期。此外,伴随智能网联汽车传感器数量的快速增加,自动驾驶车辆的数据生成量也将呈现指数级增长,这都将带来大量的数据处理需求。公司强力布局自动驾驶业务,开启车载语音数据及DMS/OMS数据业务并日臻成熟,舱外视觉场景数据业务亦基本实现全覆盖。公司已设立独立自动驾驶事业部并配置专项研发、销售、产品、项目交付团队,通过快速迭代平台工具及算法迅速提升自动驾驶业务竞争力,实现自动驾业务的快速扩张,2022年前三季度已验收订单与截止三季度末在手订单合计约5,000万元,同比增长超200%。我们认为,在自动驾驶整体加速落地的大背景下,公司自身自动驾驶数据业务能力构建基本完成,预期将同步实现快速提升,有望带动整体业务实现高速增长。
    对标Scale.AI,人机协同降本增效,有望提升毛利率。公司今年6月上线第三代自动驾驶标注平台,已基本实现自动驾驶舱外视觉场景的全覆盖。并将于年底前上线第四代自动驾驶数据处理平台,将进一步升级工具和算法功能,可支持各类型传感器及多传感器融合的数据处理、BEV(鸟瞰图)标注、点云叠加标注等多类前沿标注需求;同时算法中台能力也将持续提升。我们认为,公司自动驾驶数据标注过程中算法的引入有望降低公司的人工成本,从而提升业务毛利率。
    数安合规将重塑自动驾驶数据产业格局。今年8月末,自然资源部发布相关通知,规定了从事测绘相关工作的内资企业需获得相应资质方能准入,外商投资企业则不能申请、应委托具有相应资质的单位开展相应测绘活动。这意味着未取得测绘资质的企业将不得从事自动驾驶舱外数据的处理(包括但不限于采集、标注等)工作,进一步提高了行业准入门槛。我们认为,未来拥有测绘资质的企业将能够更快抢占自动驾驶数据市场。公司已于今年6月获批乙级测绘资质,同时受中国移动、中国互联网投资基金战略股东加持,相信将为其自动驾驶领域业务的拓展奠定更好的基础。
    2022年上半年境外市场签单额同比增长近2.5倍,前三季度境外基础训练数据业务收入同比增长近140%。近年来,公司力拓全球市场,使之成为公司收入和毛利的重要支撑。2022年,公司已启动更为全面的全球化发展战略,从品牌升级、体系搭建、团队建设、营销推广等多维度升级海外市场布局,预期未来将继续成为公司收入和毛利增长的重要引擎。
    我们预计,公司2022-2024年营收分别为2.65/3.97/6.09亿元,归母净利润为0.14/0.62/1.31亿元,对应当前市值PE分别为191/43/20倍。
    2022年收入拐点已现,可持续增长预期高,2023年有望迎来利润释放。考虑自动驾驶行业数据业务有较高成长性,本报告采用分部估值法:
    基础数据业务:考虑公司语音方面积累深厚,尤其是多语种方面的积累和能力,可以更好服务境外公司全球化布局。公司从2021年开始制定了更为全面的全球化发展战略,从品牌升级、体系搭建、团队建设、营销推广等多维度升级海外市场布局,大大提升海外客户触达和服务能力,2022年上半年境外业务增势显著,考虑以上情况,对该部分适用PE估值方法。根据我们预测,2023年基础数据业务净利润达0.54亿元,参考可比公司中科创达/四维图新/德赛西威PE估值平均45.51x,考虑公司境外基础数据业务增速较快给予该业务2023年50xP/E,对应市值27亿元。
    智能驾驶行业数据业务:考虑自动驾驶的高景气度,公司对自动驾驶平台的持续高投入,且获得乙级测绘资质,公司计算机视觉业务营收有望迎来高增长,考虑该业务的高投入及高成长性,对公司该部分适用PS估值方法。根据我们预测,2023年公司智能驾驶行业数据业务营收达1.09亿元,参考可比公司格灵深瞳/中科创达/虹软科技PS估值平均10.29x,鉴于公司智能驾驶行业数据业务为新业务且增速较快,给予该业务2023年12xP/S,对应市值13.08亿元。
    综上,结合基础数据业务PE估值以及智能驾驶行业数据业务PS估值,给予公司目标市值40.08亿元,目标价93.64元,首次覆盖,给予"买入"评级。
    风险提示:技术迭代风险;汇率波动风险;新客户收入占比较低的风险;市场竞争加剧风险。

[2022-09-05] 海天瑞声(688787):海外业务增势明显,智驾平台化能力不断增强-2022年中报点评
    ■华创证券
    事项:
    公司发布2022年半年度报告:上半年,公司营业收入1.15亿元,同比增长8%;归母净利润为0.19亿元,同比减少49%;归母扣非净利润为0.08亿元,同比减少76%。Q2单季,实现营收0.67亿元,同比增长8%,归母净利润为0.10亿元,同比减少53%,扣非净利润0.04亿元,同比减少81%。
    评论:
    海外业务增势明显。智能语音类产品实现收入0.82亿元,计算机视觉0.21亿元,自然语言0.10亿元,数据资源相关的应用服务0.01亿元。今年上半年海外业务增势明显,收入占比大幅提升至57.14%,境外市场签单额同比增长近2.5倍,整体拉升公司业务收入水平。截止报告期末,企业服务客户数量已达到740家(2022年H1新增客户45家)。
    持续加大投入带动费用率提升。毛利率方面,22H1为66.38%,同比减少4.44pct;销售费用率、管理费用率、研发费用率为7.22%、19.80%、37.18%,同比分别+2.18pct、+8.98pct、+14.53pct。公司费用率提升较高,主要系公司在研发体系迭代、管理架构及激励体系升级、营销体系全球化建设方面继续加大投入,22H1公司人员数量达到272人,同比增幅达到47.83%,为公司未来3-5年快速扩张提供持续强劲的内在动力。其中,研发人员较年初增加16人,同比增幅达72%。
    重点布局智能驾驶业务,平台化能力不断增强。公司去年已经完成智能驾驶团队的搭建,今年上半年公司完成了第三代智能驾驶标注平台上线,平台工具链基本实现了智能驾驶舱外视觉场景的全覆盖(包括50多种2D标注及重点3D标注功能),预计将于年底上线第四代智能驾驶标注平台,其将进一步完善3D功能。截至2022年6月底,公司已服务超过40家智能驾驶领域客户,覆盖传统车企、新势力车企、智能驾驶技术公司等。此外,公司已于报告期内通过北京市规划和自然资源委员会行政许可,获得乙级测绘资质,为公司智能驾驶采集业务拓展奠定基础。
    投资建议:考虑到公司新业务仍处于投入期,因此我们预计公司2022-2024年营收分别为2.70亿元、3.52亿元、4.47亿元,下调归母净利润预测为0.34亿元、0.50亿元、0.68亿元,对应当前EPS分别0.80、1.17、1.59元(22、23年前值2.32、2.89元)。参考可比公司给予23年50倍PE,给予目标价58.5元,首次覆盖,给予"推荐"评级
    风险提示:核心产品迭代速度不及预期风险,产品研发进度不及预期,行业竞争加剧。

[2022-08-15] 海天瑞声(688787):海天瑞声股东拟合计减持不超16.34%股份
    ■上海证券报
  海天瑞声公告,股东唐涤飞及其一致行动人中瑞立计划减持公司股份合计不超过公司股份总数的6%;股东清德投资计划减持公司股份合计不超过公司股份总数的5.95%;股东上海丰琬计划减持公司股份合计不超过公司股份总数的4.39%。

[2022-01-05] 海天瑞声(688787):海天瑞声为客户提供多款与虚拟人相关的训练数据产品
    ■证券时报
   海天瑞声(688787)在互动平台表示,公司提供的训练数据覆盖智能语音(语音识别、语音合成等)、计算机视觉、自然语言等多个AI核心领域,并被广泛应用于各头部互联网、及社交类产品/应用。目前公司为客户提供多款与虚拟人相关的训练数据产品,例如King-AV-018。 

[2021-08-22] 海天瑞声(688787):AI算法的"加油站"-首次覆盖报告
    ■国盛证券
    国内领先的AI模型训练数据提供商。公司成立于2005年,专注于将自然数据源专业化加工为可供AI公司训练使用的工程化数据集,可谓AI算法的"加油站",已经覆盖微软、腾讯、百度、科大讯飞等头部AI企业客户。公司核心团队具备学术与行业背景,为公司长期发展打下坚实基础。虽然疫情带来短期扰动,但公司收入利润整体持续快速增长,2016-2020年营业收入CAGR为29.02%,归母净利润CAGR为68.06%,标准化程度较高的数据库产品收入占比持续提升至21Q1的56%,毛利率近年来稳定在约70%。
    AI商业化打开数据服务市场百亿级空间,算法迭代、场景创新驱动行业成长,有望带来市场集中度提升。1)AI已进入全方位商业化阶段,全球产业规模超500亿美元,国内市场规模超400亿元,中国AI基础数据服务市场处于快速成长期,2025年有望突破百亿规模。2)AI基础数据服务上承数据生产者,下接AI应用方,是AI落地过程中不可或缺的一环。我们认为,机器学习算法迭代的天然需求与应用场景的创新是AI基础数据服务行业扩张的主要驱动力,一方面专业化的训练数据是当前AI算法发展迭代的刚需;另一方面深度学习模型对训练数据的数据量、多样性和更新速度方面提出较高要求,需要专业数据商提供服务;此外,智能物联网、产业互联网等新型场景催生增量新需求。3)当前AI数据服务市场行业集中度较低,2019年CR5仅26.2%,未来随着市场需求向精细化转型,我们预计市场集中度将进一步提升。
    一体化平台的根基是算法、资源和经验,数据积累带来规模效应和粘性,多领域、多语种能力打开成长空间。1)公司基于核心算法打造"从设计到质检"的一体化平台,赋能数据生产全流程,高效实现大规模数据加工质检,形成核心技术壁垒,我们认为竞争优势背后是技术、资源以及对垂直行业的理解。2)"数据积累-技术迭代-提升数据质量"的闭环带来明显的规模优势,对垂直行业Know-how的理解拓宽公司的竞争护城河,而头部客户的高复购率也显示了产品的高粘性,进一步带动公司对行业Know-how的理解。3)产品能力涵盖智能语音、计算机视觉和自然语言3大领域,自有训练集数据产品数量位居行业领先。虽然短期受到疫情扰动,但是我们认为多领域多语种的覆盖能力将打开公司的全球化成长空间。
    首次覆盖,给予"买入"评级,2022年目标市值72亿元。我们预测公司2021-2023年收入分别为2.82/3.99/5.47亿元,对应归母净利润0.84/1.18/1.61亿元;横向比较的AI公司的2021年PE均值约为61倍,考虑到公司在AI数据训练行业的稀缺性,给予2022年目标市值约72亿元,给予"买入"评级。
    风险提示:AI产业景气度下降;市场竞争加剧;海外贸易摩擦风险;新冠疫情恶化的风险。

[2021-08-13] 海天瑞声(688787):海天瑞声今日登陆科创板 自主创新引领人工智能训练数据服务新发展
    ■中国证券报
   8月13日,北京海天瑞声科技股份有限公司(以下简称“海天瑞声”)正式登陆上交所科创板。此次海天瑞声IPO共计发行新股数量1070万股,发行价格为36.94元/股。 
      招股书显示,本次IPO发行募集资金扣除发行费用后,海天瑞声拟分别投向自主研发数据产品扩建、一体化数据处理技术支撑平台升级、研发中心升级建设和补充流动资金四个项目。公司表示,项目建成后,公司技术水平、业务规模、产品体系等方面都将得到显著完善。 
      深耕AI基础数据服务领域 打造训练数据服务标杆企业 
      海天瑞声表示,近年来,全球人工智能产业规模快速增长,基于深度学习的智能语音、计算机视觉、自然语言处理等技术开始向各个应用领域渗透,数据是人工智能行业发展的三大核心要素之一,优质、丰富的训练数据对各类应用落地及算法模型的迭代尤为重要。随着人工智能技术研究及应用产业化落地的加速,人工智能技术和应用对于训练数据服务的依赖有明显增强的趋势。商业化进程的演进,新兴应用场景如智联网AIoT、AI PaaS、产业互联网等将展现出巨大的发展潜力,并逐步促进AI技术和算法模型的优化和创新。因此,在创新应用场景和新型算法的带动下,具有前瞻性的训练数据产品和高定制化的训练数据服务需求将逐步成为主流,而专业化的训练数据服务提供商也将在AI产业链上扮演更加重要的角色。 
      公开资料显示,海天瑞声是我国最早进入AI基础数据服务行业的企业之一,也是目前我国语音类数据资源市场份额最大的企业。自2005年成立以来,公司始终致力于为产业链上的各类机构提供算法模型开发训练所需的数据集,已成为我国领先的训练数据专业提供商。经过多年的业务实践与发展,海天瑞声目前与产业链上的各类机构都建立了长期的战略合作关系,训练数据相关的产品和服务获得了包括阿里巴巴、腾讯、百度、微软、三星、亚马逊、科大讯飞、字节跳动、中国科学院、清华大学等在内的众多大型优质客户的广泛认可,并应用于个人助手、智能音箱、语音导航、搜索服务、智能驾驶、机器翻译等多种产品相关的算法模型的训练过程中。公司在核心技术、行业经验以及专业服务能力等方面均处于行业领先地位,是具有国际竞争力、领先性的标杆企业,彰显了在基础数据服务行业的影响力。 
      掌握自主研发国产化技术生产体系 夯实训练数据建设服务能力 
      招股书显示,凭借多年的研发积累与持续创新,海天瑞声依托其100%自主研发的国产化技术体系、生产体系,自主开发了一体化数据处理平台,在基础研究、平台工具、训练数据生产三个维度均积累下核心技术,有机搭建起海天瑞声的训练数据开发一站式解决方案,提升了开发效率、服务质量及数据安全性,为下游客户提供了高质量的训练数据产品、高效率的训练数据定制服务及高水准的训练数据相关应用服务。 
      据了解,海天瑞声拥有对AI核心算法的理解能力、前瞻性的专业训练数据集设计能力、丰富的语言覆盖能力及场景采集能力,以及AI辅助标注及精细标注能力。公司已逐步建立训练数据生产领域技术壁垒和竞争优势,积累掌握了12项核心技术,广泛运用在训练数据生产的各个环节之中。通过算法与数据处理技术并用,实现高效的数据加工及质检,充分提高了训练数据的生产效率及质量控制水平,保障了数据安全;在语音语言学基础研究领域公司建立了成熟的发音词典构建流程,积累了深厚的语音语言学基础研究成果,语言覆盖能力行业领先,产品和服务已覆盖全球160余个语种/方言,构建起多语种训练数据生产服务能力,为大规模、高质量、工程化的训练数据资源产出奠定基础,并对带动人工智能行业训练数据建设与数据资源的优质发展起到了引领作用。 
      赋能AI技术与实体经济深度融合 助推基础数据服务产业新发展 
      海天瑞声此前公告显示,公司目前已覆盖智能语音、计算机视觉、自然语言处理三大人工智能核心技术领域,产品和服务范围更是覆盖语音识别、语音合成、发音词典、图像与视频识别、手写体识别、光学字符识别、语义理解、机器翻译等多个技术方向。 
      招股书显示,截至2020年12月31日,海天瑞声已拥有760余个自主知识产权的可授权使用训练数据产品,并向下游客户提供了累计超3600次/个训练数据定制服务或训练数据产品。这些产品和服务可覆盖生活交流、客服、家居、办公、行车、普通环境、噪声等多种特定场景中的语言现象和视觉呈现,构建成独具特色的训练数据集合,已应用于智能助理、智慧交通、智能搜索、智能家居、自动驾驶等16类应用领域,有效推动人工智能行业各类终端产品及应用的落地和优化,赋能人工智能技术与实体经济的深度融合。 
      海天瑞声表示,上市之后,公司将继续聚焦训练数据领域,依托技术创新手段和系统开发能力,打造和提升高品质服务体系,强化数据资源优势,以高品质的产品服务响应AI产业落地与数字经济的主旋律,实现AI应用领域的新拓展。增强并探索数据驱动行业发展的能力,全面激发和带动基础数据服务的创新活力与高速发展。 

[2021-08-13] 海天瑞声(688787):海天瑞声贺琳 做人工智能产业的“基石”
    ■上海证券报
   数据已经成为一种生产要素,前提是要把人类世界的信息转化为计算机可以识别的方式。”贺琳介绍说,人工智能行业发展涵盖了三大核心要素——算法、算力及数据。如果把发展成熟的人工智能行业比作菜肴,那么数据就是食料,算法是煎、炒、烹、炸、炖等各种烹饪方法,算力则是燃气灶、菜刀、锅、勺等烹饪工具。要想做出一道色香味俱全的菜肴,三者缺一不可。 
      “帮助客户不在数据准备阶段走弯路,助推其加速模型训练、产品落地和迭代更新是海天瑞声坚守的初衷。” 
      当不方便听语音时,点下“转文字”便能直接获得语音信息的文字翻译;当开车时,对着手机直接说出目的地便能直接获取导航路线;当进入写字楼时,对着智能安检摄像头刷脸即可通过…… 
      随着技术的不断迭代,人类已悄然迈入智能时代,机器能够像人一样,会听、会看、会说、会动、会思考及会学习,更让人类生活变得丰富多彩起来。智能时代,人们通过智能语音系统、计算机视觉系统、自然语言处理系统发送简讯、操纵汽车、遥控设备,这一切主要归功于智能语音、计算机视觉、自然语言等相关人工智能领域的应用发展。 
      “而我们所做的事情,则是作为人工智能产业的‘基石’,为产业链的技术层和应用层源源不断地提供对其至关重要的AI训练数据,用户看不到我们,却在时时刻刻体验着我们的基石作用。”海天瑞声董事长贺琳说。据悉,该公司产品和服务已获得腾讯、阿里、百度、字节跳动、微软、三星、亚马逊、科大讯飞、商汤科技、海康威视等国内外优质客户的认可。 
      8月13日,海天瑞声登陆科创板,公司将借助资本的力量强化双翼,飞向更广阔的智能天地。 
      训练数据“大王” 
      海天瑞声成立于2005年,是一家专注于为AI算法模型训练提供数据产品及解决方案的服务商。16年来,公司持续投入重金做研发,目前主营业务包括训练数据定制服务、训练数据产品及训练数据相关的应用服务三大板块,业务领域涵盖了智能语音、计算机视觉、自然语音等AI核心领域,构筑起坚实的技术壁垒,持续为客户提供高质量的训练数据产品及服务,始终努力推动着AI技术在全球各行业落地的进程。 
      随着智能客服、智能家居、智能手机助手等应用产品的广泛普及,琳琅满目的人工智能应用热潮背后,是迅猛发展的人工智能技术。而在技术背后,扮演至关重要角色的则是大规模的专业训练数据集。数据资源的规模和质量,在很大程度上决定了各种人工智能技术及应用的广度和深度,从而影响着AI应用/产品的落地及用户的体验。 
      “数据已经成为一种生产要素,前提是要把人类世界的信息转化为计算机可以识别的方式。”贺琳介绍说,人工智能行业发展涵盖了三大核心要素——算法、算力及数据。如果把发展成熟的人工智能行业比作菜肴,那么数据就是食料,算法是煎、炒、烹、炸、炖等各种烹饪方法,算力则是燃气灶、菜刀、锅、勺等烹饪工具。要想做出一道色香味俱全的菜肴,三者缺一不可。 
      贺琳所带领的海天瑞声正是我国领先的人工智能训练数据专业提供商。公司自成立以来,始终致力于为AI产业链上的各类机构提供算法模型开发训练所需的专业数据集。 
      根据招股书显示,目前海天瑞声所提供的训练数据覆盖智能语音(语音识别、语音合成等)、计算机视觉、自然语言等多个核心领域,全面服务于人机交互、智能驾驶、智慧城市等多种创新应用场景。 
      智能语音称雄天下 
      据介绍,海天瑞声在智能语音方面可谓独步天下。公司建立了成熟的发音词典构建流程、积累了深厚的语音语言学基础研究成果。截至目前,公司的产品/服务已覆盖全球160余个语种/方言,并已积累下超过100个语种/方言的发音词典,累计词条数超过1000万条,可构建高质量的智能语音训练数据集群。 
      “我们的许多客户都是全球性的大型科技公司和头部人工智能企业,他们的产品需要推广到世界各个角落,所以产品中的语种/语言功能也需要能够匹配其所布局的地方区域。”贺琳介绍说,每一种语言的研究、开发都需要花费大量的时间及成本,不同语言涉及的音素集、发音规则等设定,都需要专业的语言学家联合AI工程师一起来共同研究完成。 
      除了丰富的语言能力,公司依托自主开发的一体化数据处理平台,高质、高效地采集与处理大规模训练数据。一体化数据处理平台需要解决三方面的问题:一是如何构建底层算法结构,使人机结合处理数据的能力发挥到最优,最大程度提高数据处理效率;二是如何通过对平台和工具的反复打磨,使数据生产流转效率最大化,令训练数据的开发可以真正达到规模化;三是如何最大程度保障数据安全。海天瑞声通过多年的深耕和持续的研发投入,拥有了功能强大的一体化处理平台,实现了训练数据安全、合规生产的规模化。 
      上述罗列的“特技”,正是海天瑞声区别于业内其他数据服务商的本质特征,也是在经年累月的努力下为自己打造的深厚壁垒。公司也成为目前国内极少数有能力提供包括希伯来语、乌尔都语、缅甸语等语种数据服务的供应商,也是全球拥有自主知识产权训练数据集最多的企业之一。 
      据贺琳介绍,公司目前在以每年大概十余种语言/方言的速度不断扩充着公司的专业数据库,同时不断迭代一体化数据处理平台,加入各类新的处理功能。多年积累的核心技术和专业服务能力,使得公司能够更大规模、更有效率、更加精准地生产训练数据,在提升自身产出效率的同时也有效提高了训练数据对于客户算法模型的改善、优化效果。 
      数据是算法发展和演进的“燃料” 
      贺琳早年在中科院声学研究所工作,彼时,她与身边众多研究人工智能的好友们都遭遇一个烦恼:基础训练数据的缺乏。没有训练数据作为支撑,AI技术及其应用的研发工作就很难开展。当时的他们会时常聚在一起来讨论这个问题该怎么去解决。随着算力的突破,数据的紧缺问题更加迫在眉睫。 
      “当时我认为这是未来的一个方向,因为大家在工作中都会遇到这样的瓶颈。一些企业的研究员更想专注于做算法,但又缺乏数据。”贺琳表示,所以海天瑞声应运而生。 
      贺琳告诉记者:“数据是算法发展和演进的‘燃料’,算法、算力、数据这三个要素一定要互相作用,才能使AI行业得以发展。近年来,国家从顶层设计层面也非常重视数据的发展,并制定了很多相关的政策,特别是今年,建设人工智能行业训练数据集、发展全数据产业链已被正式纳入国家重点规划,可以说数据资源的基础性和战略性的地位已经凸显。” 
      事实上,除了提供训练数据产品外,一个专业高效的数据合作伙伴最重要的能力之一是帮助应用商们较为准确地预估投入产出比,找到与整体业务目标契合的整体服务解决方案。经过多年的业务实践与发展,海天瑞声目前与产业链上的各类机构都建立了长期的战略合作关系,产品和服务已获得阿里巴巴、腾讯、百度、字节跳动、微软、三星、亚马逊、科大讯飞、商汤科技、云知声、海康威视等国内外优质客户的认可,建立了广泛的行业知名度与影响力。 
      未来,市场对训练数据的拓展性需求和前瞻性需求均将快速增长。随着行业内对训练数据需求类型的增加以及对服务标准要求的提高,这就要求包括海天瑞声在内的数据服务商能够保持对行业发展趋势的洞察能力,深刻理解客户的应用领域及业务场景,在设计方案过程中考虑到算法对样本多样性的需求,保证数据方案能满足机器学习的需求且避免出现与模型的过拟合、欠拟合等诸多问题。 
      “帮助客户不在数据准备阶段走弯路,助推其加速模型训练、产品落地和迭代更新是海天瑞声坚守的初衷。”贺琳说,随着人工智能在全球的快速发展,对数据资源需求将持续增长。与此同时,不同类型、处于不同发展阶段的企业及组织对数据的需求也逐步展现出差异化、多元化趋势,因此对人工智能训练数据服务商的资质、研发、产能、质控、安全合规等方面都提出了更高的要求。 
      用户驱动、需求驱动、实战驱动是推动海天瑞声持续稳步前进的动能。行业的高速增长,政策的不断加持,为海天瑞声增添了更多的成长空间。而登陆科创板,则会获得更充足的资本力量,助推公司海阔天空任飞翔。 
       
               

[2021-08-12] 海天瑞声(688787):国内领先的训练数据专业提供商,受益于人工智能蓬勃发展-新股定价报告
    ■华创证券
    公司是国内领先的训练数据专业提供商。海天瑞声成立于2005年,主要从事训练数据研发设计、生产和销售业务,其训练数据应用于人工智能算法模型的开发训练,涵盖了智能语音、计算机视觉、自然语言等多个核心领域,服务于人机交互、智能驾驶、智慧城市等多种应用场景。目前公司客户累计数量已超500家,覆盖了主要的大型科技公司(阿里、腾讯等)、人工智能企业(科大讯飞、海康威视等)和科研机构(中科院)等。2020年公司营业收入为2.3亿元,毛利率、净利率分别为67.70%和35.17%。
    AI基础数据服务市场规模稳步提升,未来品牌数据服务商或占优。算法、算力和数据是人工智能产业链中技术发展的三大核心要素,训练数据是算法模型发展的基础。2019年,我国AI基础数据市场规模达到30.9亿,预计2025年将超过100亿元,复合年增长率超过20%。在细分需求中,图像类数据需求占比近一半。中国AI数据服务市场参与主体包括学术机构、政府等中立机构、需求方自建基础数据团队、基础数据服务商。2019年,基础数据服务商中的数据供应商占据近半壁江山;以公司为代表的前5大企业市场份额超过1/4。随着业务门槛的提升、客户需求多样化等情况,中小型数据供应商或面临经营困境,艾瑞数据显示,2019年中小型数据供应商份额比预期值缩小了20.8%,这部分按7:3让渡给品牌数据服务商和需求方自建数据团队。
    公司多年深耕基础数据服务行业,市场份额占优,技术实力和人才储备具备优势。公司是我国最早的基础数据服务公司之一,积累了丰富的行业经验,为下游客户提供高质量数据产品和定制服务,赢得了如阿里巴巴、腾讯、百度等众多大型优质客户的认可,目前在国内的市场份额位居行业前五,在品牌效益和业务能力方面均有较强的竞争优势。与可比公司对比中,公司营收等弱于Appen,但在训练数据覆盖的语种/方言覆盖能力、成品训练数据集储备数量等方面优于慧听科技、标贝科技。公司积极钻研核心技术,培养了优秀的行业人才,技术横跨基础研究、平台工具和训练数据生产等三大领域,成为公司提供相关产品和服务的重要支撑。
    募集资金助力公司发展。公司本次发行公司股份1070万股,实际募集资金总额为3.95亿元,主要用于自主研发数据产品扩建、一体化数据处理技术支撑平台升级、研发中心升级建设等项目,拓展公司训练数据产品覆盖的场景和领域,提升公司服务效率,增强核心竞争力。
    盈利预测、估值。我们预计公司2021-2023年营业收入增速分别为8.1%、16.7%、20.6%,归母净利润增速分别为1.3%、19.2%、24.6%,预计EPS分别为1.94、2.32、2.89元。估值方面,公司可比公司有Appen、慧听科技、标贝科技等;其中,慧听科技、标贝科技均未上市,Appen为澳洲上市公司。Appen2020财年收入为6亿澳元,净利润为5051万澳元,8月11日市值为15.24亿澳元,以此计算PE(2020)约为30倍。公司目前收入体量与Appen还有较大差距,但净利率远高于Appen。考虑到公司在AI基础数据行业的技术与市场优势,我们给予公司2021年30倍PE,对应目标价约为58.2元/股。
    风险提示:募投项目推进进程存在不确定性、行业竞争加剧。

[2021-08-04] 海天瑞声(688787):海天瑞声中签号码出炉 共7276个
    ■证券时报
   海天瑞声(688787)8月4日晚披露中签结果,中签号码共有7276个,每个中签号码只能认购500股海天瑞声A股股票。 

[2021-08-03] 海天瑞声(688787):海天瑞声启动申购 科创板将迎来头部人工智能训练数据专业提供商
    ■中国证券报
   海天瑞声启动申购 科创板将迎来头部人工智能训练数据专业提供商 
      8月3日,北京海天瑞声科技股份有限公司(以下简称“海天瑞声”)进行网上网下申购。此次发行1070万股,占发行后总股本的比例25%,申购价格36.94元/股。 
      据了解,在AI产业链中,算法、算力和数据共同构成技术发展的三大核心要素。在当前人工智能行业发展进程中,有监督的深度学习算法是推动人工智能技术取得突破性发展的关键技术理论,而大量训练数据的支撑则是有监督的深度学习算法实现的基础,训练数据已成为算法模型发展和演进的“燃料”。 
      公司此前的申报稿显示,全球基础数据服务行业处于快速成长期,市场规模具有较大的增长空间。当前我国人工智能产业加速发展,2019年中国人工智能行业的融资总额约为166亿美元,占全球的44.39%,位居全球首位。应用场景的创新和机器学习算法的流行直接带动了训练数据需求的大幅增长。 
      针对AI产业对训练数据的需求,自2005年成立以来,海天瑞声始终致力于为AI产业链上的各类机构提供算法模型开发训练所需的专业数据集。在多年的行业实践过程中,海天瑞声始终注重充分挖掘和培养自身的核心技术优势,自主开发了一体化数据处理平台,在基础研究、平台工具、训练数据生产三个维度均积累下核心技术。除拥有先进的算法与数据处理技术和自主开发一体化数据处理平台外,海天瑞声还在语音语言学基础研究方面有深厚积累。通过多年经营积累,公司已具备全球160余个语种/方言的训练数据设计开发能力,并掌握了N元语言模型训练与优化技术、文本正则化技术、基于语言模型的文本易读性评测技术等算法技术,可结合音素均衡、语料主题、覆盖领域、发音人属性、设备特征等因素综合设计满足算法模型开发、训练、拓展需要的训练数据集。 
      海天瑞声高度重视并坚持科技创新,且十分重视研发团队的知识结构和梯队建设,现有团队皆为相关专业硕士与博士以上成员构成,专业扎实、技术先进、经验丰富。截至目前,海天瑞声已获得24项发明专利授权、1项实用新型专利授权及1项外观设计专利授权,涉及基础算法研究领域、数据处理领域等,技术储备充足。截至2020年12月31日,公司拥有760余个类型丰富的自有知识产权的高品质工程化训练数据集,能够为我国AI自主技术研发提供高质量的训练数据保障。 
      基于丰富的技术积累和行业经验,海天瑞声提供的训练数据产品及相关服务已覆盖三大技术领域、多个语种/方言和多项应用场景,赢得了阿里巴巴、腾讯、百度、微软、三星、亚马逊、科大讯飞、商汤科技、中国科学院、清华大学等众多大型优质客户的认可,核心技术、产品资源、优质客户等竞争优势逐步凸显。 
      凭借优秀的产品品质、先进的技术和周到的服务,海天瑞声已经成为中国基础数据服务行业的头部企业,市场份额位居行业前五,同时在中国语音类基础数据服务领域排名第一。在持续多年的研发投入和努力下,海天瑞声荣膺多项资质荣誉, 先后获得国家重点软件企业、国家高新技术企业、中关村高新技术企业等资质,参与了国家、行业标准的起草工作。2020年,获评工信部国家专精特新“小巨人”企业;2021年,获评工信部“新一代人工智能产业创新重点任务揭榜优胜单位”,系全国唯一一家获此殊荣的AI数据企业。 
      海天瑞声将以本次IPO为全新的起点,未来将继续以数据为核心稳步发展,持续依靠自身技术积累,通过引入资本和人才等手段升级技术水平、扩大公司业务规模,持续建设、优化、创新训练数据服务,完善公司的产品体系,提升通用训练数据产品、训练数据定制服务等主线业务的领先优势,增强数据驱动人工智能行业发展的能力。 

[2021-08-03] 海天瑞声(688787):海天瑞声头部人工智能训练数据服务商
    ■上海证券报
   ——北京海天瑞声科技股份有限公司首次公开发行股票并在科创板上市网上投资者交流会精彩回放 
      出席嘉宾 
      北京海天瑞声科技股份有限公司创始人、董事长 贺 琳女士 
      北京海天瑞声科技股份有限公司董事、总经理 唐涤飞先生 
      北京海天瑞声科技股份有限公司董事、副总经理、财务负责人、董事会秘书 吕思遥女士 
      华泰联合证券有限责任公司投资银行TMT行业部总监 、保荐代表人 张 鹏先生 
      华泰联合证券有限责任公司执行总经理、保荐代表人 葛 青先生 
      北京海天瑞声科技股份有限公司 
      创始人、董事长贺琳女士致辞 
      尊敬的各位嘉宾、各位投资者、各位关心海天瑞声的网友: 
      大家好! 
      欢迎大家参加北京海天瑞声科技股份有限公司首次公开发行股票并在科创板上市网上路演推介会!在此我谨代表公司向所有参加今天网上路演推介的嘉宾和投资者朋友们表示热烈的欢迎和衷心的感谢! 
      海天瑞声自2005 年成立以来,始终致力于为全球人工智能全产业链中的企业及科研机构提供工程化训练数据资源产品和服务,经历16年的拼搏奋斗,海天瑞声已经成长为一家具备全球化业务支持与交付能力的人工智能训练数据资源提供商,累计客户已超500家,并获得了来自阿里巴巴、腾讯、百度、科大讯飞、海康威视、微软、亚马逊、三星等国内外优质客户的认可。 
      作为我国领先的AI训练数据专业提供商,近年来公司的财务状况呈持续稳定增长趋势。2017年至2020年,营业收入年均复合增长率超过25%,同时,近四年公司综合毛利率均在70%左右,净利率超过30%,盈利能力较强。 
      在当前技术发展进程中,深度学习算法是推动人工智能技术取得突破性发展的关键技术理论,而大量训练数据的支撑则是深度学习算法实现的基础。身处高速发展的人工智能领域,公司的健康发展,除了稳固现有主营业务之外,还需要对所在领域进行前瞻性技术研究,形成更广泛和深入的技术储备。海天瑞声高度重视并坚持科技创新,报告期内,公司的累计研发投入达到1.13亿元,累计研发投入占收入比重为16.96%。目前公司已经取得24项发明专利、1项实用新型专利授权及1项外观设计专利授权,134 项计算机软件著作权,通过多年的技术研发和业务实践,公司积累的核心技术横跨基础研究、平台工具、训练数据生产等三个层次,并自主开发了一体化数据处理平台,在基础研究、平台工具、训练数据生产三个维度均积累下核心技术;在语音语言学基础研究方面,公司建立了成熟的发音词典构建流程,产品和服务覆盖 160 余个语种和方言,已积累下超100 个语种和方言的发音词典,累计词条数超1,000万条。 
      在持续多年的研发投入和努力下,海天瑞声的技术实力得到行业、主管机构的高度认可。公司荣膺多项资质荣誉,先后获得国家重点软件企业、国家高新技术企业、中关村高新技术企业等资质,参与了国家、行业标准的起草工作。2020年,获评工信部国家专精特新“小巨人”企业;2021年,获评工信部“新一代人工智能产业创新重点任务揭榜优胜单位”,系全国唯一一家获此殊荣的AI数据企业。 
      今天,我们非常高兴能借此机会与广大投资者进行沟通,使大家进一步了解海天瑞声。我们坚信,广大投资者的高度信任与大力支持,将是海天瑞声成功发行的重要保证。 
      未来,海天瑞声将借助资本市场的力量,持续不断地加快技术创新速度,提高产品质量,以卓越的产品品质,和优异的经营业绩,为客户、股东、员工及社会创造超值回报! 
      谢谢大家! 
      华泰联合证券有限责任公司 
      投资银行TMT行业部总监、保荐代表人张鹏先生致辞 
      尊敬的各位投资者,各位关心支持海天瑞声的网友: 
      大家下午好! 
      作为北京海天瑞声科技股份有限公司首次公开发行股票的保荐机构和主承销商,华泰联合证券与海天瑞声今天共同举办网上路演活动,在此,我谨代表华泰联合证券有限责任公司,向所有参加今天网上路演的投资者朋友和网友,表示热烈的欢迎和衷心的感谢! 
      海天瑞声是我国领先的人工智能训练数据专业提供商,主要从事训练数据研发设计、生产及销售业务,所生产的训练数据主要运用于人工智能算法模型开发训练,公司生产的训练数据覆盖智能语音、计算机视觉、自然语言等多个AI核心领域,被广泛应用于智能音箱、语音导航、搜索服务、智能驾驶、机器翻译等多种产品相关的算法模型训练过程中。公司服务的下游客户累计超过500余家,覆盖了包括阿里、腾讯、百度、科大讯飞、微软、亚马逊、三星在内的大型科技公司、人工智能企业及科研机构。2020年,海天瑞声获评工信部国家专精特新“小巨人”企业;2021年,公司获评工信部“新一代人工智能产业创新重点任务揭榜优胜单位”,技术实力得到行业、主管机构的高度认可。 
      华泰联合证券作为海天瑞声本次发行上市的保荐机构和主承销商,我们将勤勉尽责履行保荐职责和持续督导义务,以优质高效的专业化服务帮助投资者朋友们更加深入了解公司的投资价值和投资机会,希望通过我们和公司的共同努力与广大投资者分享企业的发展成果。 
      最后,预祝海天瑞声本次网上路演活动圆满成功,谢谢大家! 
      北京海天瑞声科技股份有限公司 
      董事、副总经理、财务负责人、董事会秘书 
      吕思遥女士致结束词 
      尊敬的各位嘉宾、各位投资者、各位网友: 
      大家好! 
      今天的网上交流已接近尾声,感谢广大投资者的热情关注和踊跃提问,感谢上证路演中心和中国证券网所提供的交流平台和优质的服务。同时也感谢保荐机构、主承销商华泰联合证券以及所有中介机构为海天瑞声发行上市所做的努力和辛勤劳动! 
      今天,各位投资者朋友从各个方面与我们进行了深入的交流,大家提出了很多非常中肯、具有价值的建议,在今后的经营管理中,海天瑞声一定会认真考虑、吸收这些建议,并把朋友们的真知灼见融入到海天瑞声的经营、管理和发展之中,以更好的业绩来答谢大家的关心与厚爱。 
      虽然本次网上投资者交流会即将结束,但我们真诚地希望海天瑞声与广大投资者交流才刚刚开始。希望大家能继续与我们保持密切的沟通。海天瑞声将不断提升竞争力,保持并扩大公司优势,创造更大的价值空间! 
      最后,再一次由衷感谢大家百忙之中抽出时间参加本次路演活动,谢谢大家! 
      经营篇 
      问:请简要介绍一下公司的主营业务。 
      贺琳:海天瑞声是一家人工智能训练数据专业服务商,主要从事训练数据的研发设计、生产及销售业务。公司通过设计数据集结构、组织数据采集、对取得的原料数据进行加工,最终形成可供AI算法模型训练使用的专业数据集,通过软件形式向客户交付。 
      问:公司的核心技术有哪些? 
      唐涤飞:公司积累的12项核心技术分别为语音识别算法、语音合成算法、计算机视觉算法、语音语言学基础研究、训练数据设计技术、一体化数据处理平台、多语种多模态训练数据设计技术、多模态多通道数据采集技术、数据同步技术、实时采集质控技术、大数据驱动的高效数据处理技术及分布式高性能自动校验技术。 
      问:公司的客户量有多少?主要面向哪些客户? 
      贺琳:海天瑞声目前客户累计数量超500家,基本覆盖了主要的大型科技公司、人工智能企业及科研机构;公司的产品和服务已获得阿里巴巴、腾讯、百度、科大讯飞、海康威视、微软、亚马逊、三星等国内外客户的认可,应用于其研发的个人助手、智能音箱、语音导航、搜索服务、智能驾驶、机器翻译等多种产品相关的算法模型训练过程中。 
      问:公司都有哪些技术创新机制? 
      贺琳:为了保持并加强在训练数据领域的优势,公司采取了一系列战略举措、构建起技术创新机制,促进公司技术和产品的持续创新,有机结合行业前沿技术革新、下游客户新产品和新技术的研发及公司自身训练数据业务的三大创新要素,实现创新目标,形成产业互动与协同。同时,公司积极通过文化建设营造鼓励创新的工作氛围,结合一系列机制保障开拓创新的工作环境,充分利用薪酬、奖励、表彰等多种方式激发员工的主观能动性,结合公司的主营业务,形成勇于开拓、积极创新的创新环境。 
      问:请介绍公司产品的销售模式。 
      贺琳:公司采用直接对接并服务客户的直销模式进行营销,符合行业通行惯例。公司以高品质的训练数据产品和服务吸引客户,并在持续服务客户的过程中提升服务价值和客户黏度。公司通过口碑传播、参与学术会议、官方网站展示等方式建立品牌知名度、与客户建立联系,后续再通过商务谈判、招投标等形式获取具体业务机会。 
      问:公司的资产结构如何? 
      吕思遥:2018、2019和2020年报告期各期末,公司资产总额分别为2.12亿元、4.05亿元和4.77亿元。2019年末和2020年末,公司资产总额较上年末分别增长90.53%和18.00%,资产总额逐年增长。 
      问:公司目前有多少专利? 
      贺琳:截至目前,公司拥有已授权专利26个、软件著作权134项,自行研发了多种核心软件工具和平台类工具并投入训练数据生产过程中,可覆盖智能语音、自然语言、计算机视觉等各领域训练数据的开发,实现了训练数据产品从设计、采集、加工到质检的全流程技术支持。 
      发展篇 
      问:公司未来有哪些发展规划? 
      贺琳:公司未来将进一步扩大在训练数据领域的优势,将核心技术和研发生产流程体系应用延伸到行业训练数据的生产、研发中,紧跟下游需求变化,加深对下游基础技术的理解并开发更多的业务机会。公司希望通过不断拓宽训练数据产品/服务的应用领域覆盖、扩展服务链跨度并升级服务质量,使得公司的训练数据产品和服务的发展能够匹配算法、算力发展进度,共同推动产业发展。 
      问:公司的竞争优势有哪些? 
      贺琳:公司竞争优势主要体现在:技术优势,包括多年积累的多项核心技术及数据处理使用的工具、平台;资源优势,包括数百个自有知识产权的产品,多场景、多语言覆盖能力,丰富的多语种语言学家团队资源积累及稳定合作的供应商、客户等上下游资源;人才优势,公司高管及核心技术人员有着深厚的技术背景和丰富的行业经验。 
      问:公司的在研项目有哪些? 
      唐涤飞:在多年的行业实践及经营过程中,公司高度重视自身的核心技术优势的挖掘和培养,秉承基础研究与实际应用紧密结合的原则,持续研究、开发、完善训练数据生产所需的基础工具和管理平台。公司目前主要在研项目包括:海天瑞声OCR在线生产平台二期、支持无人车场景的语义分割平台、支持语音数据库的语料标注、在线平台。 
      问:相较于通过大量劳务人员采集数据的企业,贵公司在处理数据上有什么优势? 
      唐涤飞:公司积累了12项核心技术,其中在多语种的语音语言学基础研究和高效数据处理两大领域积累了5项关键核心技术。通过算法与处理技术并用,可以满足算法在不同应用场景下的训练数据需求,可对大规模数据进行高效的加工或质检。 
      行业篇 
      问:公司属于哪个行业? 
      贺琳:公司所属行业为“软件和信息技术服务业”,行业代码为“I65”;海天瑞声所在细分领域为人工智能基础数据服务领域,位于基础数据服务行业的中游,属于基础数据服务商。 
      问:我国目前的AI产业规模发展到什么程度了? 
      贺琳:当前我国人工智能产业加速发展,从基础支撑、核心技术到行业应用的产业链条基本形成,一批创新活跃、特色鲜明的创新企业加速成长,新模式、新业态不断涌现,整体呈现蓬勃发展态势。政策支持、投资引导和巨头布局将推动中国AI产业的结构调整,进一步扩大市场规模。 
      问:您认为未来我国的基础数据服务行业发展前景如何? 
      贺琳:从AI产业链的发展情况和未来发展趋势来看,中国基础数据服务行业的市场规模将不断扩大。一方面,随着算法模型、技术理论和应用场景的优化和创新,AI产业对训练数据的拓展性需求和前瞻性需求均快速增长;另一方面,随着行业内对训练数据需求类型的增加以及对服务标准要求的提高,产业链的专业化分工将愈加清晰,专业化的训练数据服务提供商将扮演更加重要的角色。 
      问:公司的核心技术是否被业内看好? 
      唐涤飞:公司自2009年至今连续荣获“国家高新技术企业”及“中关村高新技术企业”称号,并于2018年被评为国家规划布局内重点软件企业。2020年,获评工信部国家专精特新“小巨人”企业;2021年,获评工信部“新一代人工智能产业创新重点任务揭榜优胜单位”,系全国唯一一家获此殊荣的AI数据企业。此外,公司是“中国人工智能产业发展联盟”、“中国语音产业联盟”的理事单位,参与了行业的标准的起草工作,在训练数据集的架构设计、开发标准、质检评测等领域,以专业性和创新性获得了行业的普遍认可。 
      发行篇 
      问:本次发行的承销方式是什么? 
      张鹏:本次发行的承销方式是余额包销。 
      问:本次募集资金投入项目后对公司有什么影响? 
      贺琳:投入项目后将完善公司训练数据产品体系,升级公司提供训练数据服务及生产训练数据产品的数据处理技术和工具,提升公司的生产服务效率和技术水平,增加公司的前瞻性技术储备,助力公司在训练数据开发及服务领域实现技术创新、提高核心竞争力。 
      问:请简要介绍募投的自主研发数据产品扩建项目。 
      唐涤飞:本项目总投资2.49亿元,分两年投入。本项目即是海天瑞声顺应人工智能应用领域拓展、增厚自有知识产权训练数据产品储备,满足业内新发训练数据需求而规划的。结合公司对市场需求的判断,本项目在原有600多个训练数据产品的基础上,进一步拓展公司自有知识产权训练数据产品的种类和领域覆盖,储备覆盖更大规模、更多类型、更多环境、更多情感、更多场景的训练数据产品。本项目计划新开发共计151个自有知识产权的训练数据产品,分别覆盖智能语音领域、计算机视觉领域和发音词典领域。新开发的训练数据产品将服务于语音助手、智能家居、智能驾驶、智慧城市、智能硬件和数字娱乐等前景广阔的AI下游行业。本项目将在人力、设备和场地方面进行投资。 
      问:请简要介绍募投的研发中心升级建设项目。 
      唐涤飞:本项目总投资1.66亿元,分两年投入本项目拟聚焦于语音识别、声纹识别、语种识别、语音合成、自然语言处理、计算机视觉识别、计算机视觉分割与处理7个方向的前沿技术,服务于公司语音识别、语音合成、自然语言处理、计算机视觉4个业务方向,提升完善从产品研发到服务客户全流程的各环节,保证公司发展的持续竞争力和领先优势。 
      问:请简要介绍募投的一体化数据处理技术支撑平台升级项目。 
      葛青:本项目总投资2.51亿元,分两年投入。本项目拟在公司现有的一体化数据处理平台及其工具集合的基础上,扩充研发团队,提升生产工具、平台系统性开发实力;投入先进的开发设备和软件,推进测试实验室建设,升级建设数据处理工具及平台,为公司的训练数据生产提供支持。 
      问:公司上市后的发放股票股利的具体条件? 
      吕思遥:在满足现金分配股利之余,在保证公司股本规模和股权结构合理的前提下,基于回报投资者和分享企业价值的考虑,从公司成长性、每股净资产的摊薄、公司股本规模和公司股票价格的匹配性等真实合理因素出发,当公司股票估值处于合理范围内,公司可以提出并实施股票股利分配方案。 

[2021-07-26] 海天瑞声(688787):海天瑞声登陆科创板 聚焦训练数据集推动AI产业落地
    ■证券时报
   投资要点: 
      1.AI训练数据领头羊,业绩增长快速,盈利能力强劲。公司长期专注于训练数据的研发生产,已成为国内AI基础数据行业领先者,尤其在语音类市场市占率排名第一。2017年至2020年,营业收入年均复合增长率超过25%,且销售毛利率保持在65%及以上。 
      2.技术实力强劲,紧握优质客户资源。公司拥有760多个自有知识产权的训练数据集产品,具备多场景、多语言覆盖能力,积累了丰富的多语种语言学家团队,并与下游的阿里巴巴、腾讯、百度、微软等客户形成了稳定合作关系。 
      3.人工智能市场持续增长,推动训练数据行业成长。“十四五”规划将人工智能提升至国家战略层面,随着政策落地、技术突破和产业融合,我国人工智能步入黄金发展期。同时,IDC预测未来几年我国AI产业规模年复合增长率可达到30%,将拉动上游训练数据需求不断增长。 
      近年来,人工智能的发展得到了巨大的进步,深刻改变着各行各业,渗透到人们的日常生活中。数据作为人工智能发展的重要元素,从本质上决定了人工智能的进化水平,优质、丰富的训练数据对人工智能技术的发展至关重要。 
      经过多年深耕,海天瑞声(688787.SH)已成为中国AI基础数据服务行业的头部企业。公司所提供的训练数据覆盖智能语音、计算机视觉、自然语言等多个核心领域,全面服务于人机交互、智能驾驶、智慧城市等多种创新应用场景。如今,海天瑞声科创板IPO已经通过证监会注册,即将挂牌上市。 
      AI持续高增长,海天瑞声领跑训练数据赛道 
      随着大数据、云计算、物联网等技术的发展,人工智能领域相关技术的产业化进程开启,产业规模快速增长。根据国际数据公司(IDC)的数据,2020年中国人工智能产业规模将达到62.70亿美元,预计2024年将达172.16亿美元,年复合增长率达到30.40%。 
      训练数据资源是机器学习的基本素材,应用场景的创新和机器学习算法的流行直接带动了训练数据需求的大幅增长。艾瑞咨询的研究报告显示,2019年中国基础数据服务行业的市场规模达到30.9亿元,预计2025年将突破100亿元,复合年增长率达到21.8%。 
      海天瑞声成立于2005年,始终致力于为AI产业链上的各类机构提供算法模型开发训练所需的专业数据集。2017年至2020年,海天瑞声的营业收入从1.19亿元增长至2.33亿元,年均复合增长率达25.15%。其中,训练数据定制服务和训练数据产品是主要收入来源,从2020年数据来看,二者占总营业收入的比例分别为50.26%、45.48%。不仅如此,这两类业务均表现出较强的盈利能力,带动公司总体盈利水平的提高。2020年公司综合毛利率水平为67.70%,净利率达到了35.17%。 
      凭借丰富的技术积累和行业经验,公司提供的训练数据产品及相关服务已覆盖三大技术领域、多个语种/方言和多项应用场景,赢得了阿里巴巴、腾讯、百度、微软、三星、亚马逊、科大讯飞、商汤科技、中国科学院、清华大学等众多大型优质客户的认可,核心技术、产品资源、优质客户等竞争优势逐步凸显。 
      公司在行业内占据领先地位,根据艾瑞咨询发布的《2020年中国AI基础数据服务行业研究报告》,2019年海天瑞声在国内基础数据服务行业以约8%的市场份额位列第二;同时,公司牢牢掌握着中国语音类基础数据服务这个细分市场,营收份额占比排名第一。 
      产品布局完善,研发创新打造核心竞争力 
      由于人工智能技术在场景中应用不断深化,单一技术实现的技术闭环难以满足复杂场景下的智能化需求,客户对于智能算法的能力要求也在持续升高。海天瑞声始终秉承基础研究与实际应用紧密结合的原则,持续开展基础研发等研究创新工作。 
      技术研发有赖于公司长期经验积累、人才储备。公司高管及核心人员大多毕业于清华、北大、中科大、复旦等一流院校,大部分曾在微软、阿里巴巴、英特尔、IBM、中科院等业内领先成熟企业与研究机构,并担任人工智能领域技术研发与管理的领导职务。高素质的技术团队形成公司强大的研发与服务优势。 
      近年来公司不断加大研发投入,2018年、2019年及2020年公司研发费用分别为2734.53万元、4169.61万元及4349.75万元,呈逐年上升趋势。这三年时间里,公司累计研发投入达到11253.89万元,累计研发投入占收入比重为16.96%。 
      公司的科技成果转化效益明显。截至目前,公司已取得26项专利授权(其中24项为发明专利,1项为实用新型专利、1项为外观设计专利)、拥有134项计算机软件著作权,另有2项专利已提交申请且已经受理,处于行业领先地位。 
      通过集中优势力量、定向攻关,海天瑞声建设完成了760多个自有知识产权的AI训练数据集,并向下游客户提供了累计超3600次/个训练数据定制服务或训练数据产品,产品和服务线可支持全球超过160个语种和方言,构建了全球领先的独具特色的人工智能训练数据资源集群。 
      值得一提的是,公司基于自身近十六年数据服务经验,并融合了数十项核心技术及专利,打造了一体化数据处理平台。平台内上千个自研标注工具联合打通,不仅可以用来处理复杂的交叉业务场景数据,更重要的是保证了数据从采集到脱敏、清洗、标注、质检等全流程不出平台即可完成,构建了流程化、规范化和体系化的训练数据生产体系。在平台支持下,训练数据生产成本大幅降低,产能和效率明显提高。 
      在持续努力下,海天瑞声的技术实力得到行业、主管机构的高度认可。公司荣膺多项资质荣誉,先后获得国家重点软件企业、国家高新技术企业、中关村高新技术企业等资质,参与了国家、行业标准的起草工作。2020年,获评工信部国家专精特新“小巨人”企业;2021年,获评工信部“新一代人工智能产业创新重点任务揭榜优胜单位”,系全国唯一一家获此殊荣的AI数据企业。 
      此外,数据服务生产过程中对个人隐私信息的安全保护,是海天瑞声一直坚守的生命线。公司配备了专业的数据保护团队及审查机制,采取严格的人员权限管理、实时监控等措施,充分保障了数据的安全可控。对隐私保护的高度重视,使得海天瑞声取得了一系列国际国内权威安全认证证书,日前获得的ISO/IEC27701被BSI(英国标准协会)称为“重要的全球性隐私保护标准,具有最严苛的资质审核”。 
      募投项目与估值 
      海天瑞声本次科创板IPO拟公开发行不超过1070万股,拟募集资金约7.66亿元,主要投向自主研发数据产品扩建项目(2.49亿元)、一体化数据处理技术支撑平台升级项目(2.51亿元)、研发中心升级建设项目(1.66亿元),并补充流动资金(1亿元)。 
      估值方面,由于公司同行业竞争对手均未上市,从主营业务和上市板块的相关性出发,参考招股书,选取了荣科科技、彩讯股份、天玑科技、四方精创、恒生电子、用友网络、万兴科技、泛微网络等作为可比公司。Wind数据显示,8家可比公司PE(TTM)算术平均值为65倍左右。 
      考虑到科创板的溢价率和公司未来的成长性,我们给予海天瑞声35倍-40倍估值。海天瑞声过去四年营业收入复合年增长率超过25%,预计2021年将保持同等增速,按同等盈利水平计算,对应的每股价格区间为84元-96元/股。 

=========================================================================
免责条款
1、本公司力求但不保证数据的完全准确,所提供的信息请以中国证监会指定上市公
   司信息披露媒体为准,维赛特财经不对因该资料全部或部分内容而引致的盈亏承
   担任何责任。
2、在作者所知情的范围内,本机构、本人以及财产上的利害关系人与所评价或推荐
   的股票没有利害关系,本机构、本人分析仅供参考,不作为投资决策的依据,维赛
   特财经不对因据此操作产生的盈亏承担任何责任。
=========================================================================