查看原文
其他

星环科技CEO孙元浩:“国产大数据基础软件第一股”是认可,更是沉甸甸的责任丨数据猿专访

月满西楼 数据猿 2022-10-19





‍数据智能产业创新服务媒体

——聚焦数智 · 改变商业




终于,在万众期待下,星环科技于10月18日正式敲钟上市了。作为“国产大数据基础软件第一股”,业界对星环科技有诸多期待,希望这是吹响我国大数据产业更快发展的冲锋号。那么,国产大数据基础软件到底发展得如何,上市之后的星环科技接下来会作何打算,国产大数据如何赋能我国的产业数字化征程?

带着这些问题,数据猿独家专访了星环科技创始人&CEO孙元浩先生,探讨他心目中的星环科技以及国产大数据产业。

外国的月亮并没有更圆,星环科技多项技术领先国外大数据厂商


孙元浩认为,国内的大数据企业经过多年的发展,在核心技术领域已经有足够的积累。中国的大数据技术实力并不弱于国外,在某些领域甚至比国外领先几年时间。以星环科技为例,目前星环科技已经重构了大数据与分布式数据库软件栈,在分布式技术、SQL 编译技术、数据库技术、多模型数据的统一处理技术、基于容器的数据云技术以及大数据开发与智能分析技术六个方面,积累了31 项核心技术,获授权境内专利77项,其中发明专利74项,获得境外专利8项。据孙元浩介绍,目前星环科技已经在分布式技术、多模型融合技术、云原生技术三个大数据核心技术领域,确立了领先优势:分布式技术,领先国外两三年。在分布式技术领域,星环科技的一个重要创新是基于分布式软件架构设计了全新的大数据技术栈,实现了统一的分布式计算、分布式一致性技术、分布式存储管理技术和分布式事务技术,使用统一融合的数据平台取代了业界的混合架构。孙元浩指出,星环科技早在2015 年就开始支持分布式事务技术,提供了强一致性(Strong Consistency)和完整性的保障,打破了当时业界普遍认为大规模分布式系统只能实现最终一致性(Eventual Consistency)的认知。相对而言,业界同行普遍在2018 年以后才实现该特性,即使对标国外大数据厂商,星环科技也领先两三年时间。在大数据技术架构上的创新,让星环科技可以借助统一内联的架构高效搞定湖仓集一体、HTAP等复杂场景,而不是拼凑组件成散装架构,这会带来巨大的性能优势。在性能上,星环科技自研的高性能分布式计算和存储引擎,整体性能是CDP的 5~25倍,整体性价比是DB2 的20倍,TD 的100倍。星环科技过硬的技术能力,也得到业界权威机构的认可。2018年,星环科技的大数据基础平台TDH成为全球首个通过TPC-DS基准测试并经官方审计的产品,领先国外大数据厂商2-3年;2018年,在知名分析机构 Wikibon发布《2018年大数据与分析供应商报告》中,认定星环科技是“产品策略对西方供应商非常具有指导意义的中国公司”;2022年,星环科技的分布式分析型数据库ArgoDB、分布式交易型数据库KunDB、分布式图数据库StellarDB入选Gartner《中国数据库市场指南》。同时,基于分布式图数据库StellarDB的先进性和在金融、政府,交通等众多行业的应用积累,星环科技今年被Gartner《图数据库管理系统市场指南》列为全球代表厂商。多模型融合技术,领先国外同行一代。随着社会数字化转型的推进,除了积累的数据量越来越大,还有一个关键特征,那就是数据的类型越来越多样化,图片、语音、视频等非结构化数据占比越来越大。为此,大数据平台需要处理的数据类型的逐渐多样化,键值、宽表、文档、图、空间、时序等一系列全新的数据处理平台随之出现,而业内既有的数据产品大多只能处理一种类型的数据。这种情况下,企业需要针对不同的数据类型采用不同的数据库,而多个数据库混合使用会带来一系列问题,比如不同数据库之间导入导出、数据在不同库中的一致性保持、整体运维的难度和成本等等。为了解决这个问题,星环科技早在2018年就提出多模型融合架构,并于2020年正式发布了多模型统一处理技术,领先同行一代,甚至远远早于一些国际权威分析机构对于多模技术的关注。星环科技自研的大数据基础平台TDH就是基于多模型统一架构,实现了统一SQL引擎、统一的分布式计算引擎、统一的分布式数据管理系统、统一的资源管理系统,支持关系型、图、时序、对象存储、搜索引擎、地理空间、事件存储等,共支持10种数据模型,一站式满足企业业务创新需求。2022年Gartner发布的《中国数据库管理系统供应商甄选》中,星环科技成为覆盖7个或以上品类的四家厂商之一和Gartner认可的四家多模厂商之一。云原生技术,领先Cloudera、Snowflake两年。在云原生领域,星环科技在业界较早提供了基于容器的统一资源管理技术、多租户隔离技术和统一的工作负载管理技术。早在2017年5月,星环科技就发布了容器云技术,将大数据技术与容器云技术有效结合。相对而言,国外知名大数据厂商Cloudera直到2020年才通过与Red Hat合作,对外提供容器云解决方案,滞后星环科技近3年时间。此外,星环科技在2018年5月推出基于容器云技术的数据云平台TDC,实现“数据云”架构,而国外的Snowflake在2020年才开始大力推广“数据云”技术架构,比星环科技滞后两年。需要指出的是,在容器技术上的创新,让星环科技在信创适配方面具备领先优势。星环基于容器化技术实现统一的资源管理,使得其大数据产品支持多种架构的芯片和操作系统,也支持国产 CPU 与 X86 架构的混合部署模式,能够运行在异构 CPU 架构以及多种操作系统混合部署的集群环境中。这一技术大大降低了星环科技的大数据产品与国产CPU、操作系统进行信创适配的难度,也大大降低了客户的大数据系统进行国产化替代的难度。目前,星环的大数据平台已完成与主流信创生态厂商的适配互认工作,适配长城飞腾、华为泰山、浪潮等服务器,鲲鹏、麒麟、统信等操作系统,并有较多的实际落地案例。此外,孙元浩指出,相对于国外大数据厂商,国内厂商在保障数据安全方面有天然的优势。美国大数据厂商的安全机制是基于美国的法律和技术标准设计的,这些安全机制并不会出口到中国,或者对中国进行出口管制。而以星环科技为代表的国产大数据厂商,则是依据中国的数据安全法律来设计安全机制,并借助身份鉴别、访问控制、审计等技术,对数据进行自动分级、分类、数据脱敏等处理,更好地保障数据安全。并且,国外大数据产品可能存在漏洞甚至后门,存在潜在安全隐患,而国产大数据平台则不存在这个问题。星环科技作为高度自研的大数据平台厂商,源代码自主研发,对自身产品技术更加了解,可以提供原厂的技术支持,提供SLA保障,保障cve漏洞等问题可以得到快速修复,这些优势是国外大数据厂商所不具备的。继往开来,要持续打造一个更好的星环科技


孙元浩告诉数据猿,上市绝不是星环科技的终点,而是下一个发展阶段的起点。有了资本市场的助力,星环科技将开始全新的征程。接下来,星环科技将在技术产品研发和商业化两方面持续发力。核心技术研发大数据技术还处在快速发展过程当中,数据库、数据管理、数据挖掘、数据智能分析等多个领域新技术层出不穷。在这种情况下,任何优势都只是暂时的,如果故步自封,很快就会被其他厂商超越。孙元浩认为,星环科技虽然已经取得一定的领先优势,但绝不应该停滞不前,而是要加快技术创新的步伐。注重研发是星环科技的传统,近几年其研发投入都保持了高速增长态势。2021年,星环科技研发费用1.4亿元,占营收的42.46%,同比增长28.31%。

星环科技研发费用情况 数据来源:星环科技招股书 数据猿整理星环科技此次上市,预计募资约14.3亿元,主要投向大数据与云基础平台、分布式关系型数据库、数据开发与智能分析软件工具的进一步研发和行业应用。其中,大数据与云基础平台建设项目,是在公司已有的大数据基础平台及数据云平台的基础上研发新一代产品,并根据市场需求建设必要的云服务平台,支撑新的产品和服务,在已有的SQL 编译技术、分布式一致性技术、分布式数据存储管理技术、分布式计算技术等核心技术基础上进一步提升技术先进性;分布式关系型数据库建设项目,是在SQL 编译技术、SQL 优化技术、分布式交易型数据库技术、多模型统一分析技术等基础上,进一步研发新一代分布式关系型数据库ArgoDB 和 KunDB,提升公司数据库产品在分析型应用场景、高并发交易场景、交易与分析混合等业务场景下的竞争力;数据开发与智能分析工具软件研发项目,是在资源管理与调度技术、分布式机器学习技术、知识抽取与 图深度学习技术、知识图谱技术等基础上,进一步研发新一代大数据开发工具 TDS 和数据智能分析工具 Sophon,为客户提供更丰富的数据智能服务。星环科技持续加大研发投入,一方面是不断提升技术能力,另一方面是丰富产品体系,为客户提供一站式大数据服务。对于星环科技而言,更完备的产品体系,对于提升营收规模有重要意义。

星环科技产品体系发展历程服务更多行业客户,提升单客户价值。孙元浩透露,星环科技计划未来两年实现营收翻一番的目标。近几年,星环科技的营收都保持了较快的增长态势。要进一步提升收入水平,一方面需要增加客户数量,另一方面是为已有的客户群提供更高价值的大数据服务。从星环科技的业务结构上看,其基本盘是大数据与云基础平台业务,但分布式关系型数据库、数据开发与智能分析工具软件以及数据应用解决方案业务的营收占比在持续提高,成为驱动星环科技营收增长的核心引擎。其中,大数据与云基础平台业务继续赋能数字经济和产业数字化;分布式数据库则重点开拓信创市场,深耕金融、政务、能源、电信等行业客户;数据智能分析工具则作为整个大数据价值链的重要一环,为客户提供一站式数据智能服务。

星环科技各项业务营收占比 数据来源:星环科技招股书星环科技通过交叉销售方式,为老客户提供更丰富的产品,以此来提升客户价值。例如,某个2021年拓展的大数据与云基础平台客户,在2022年不仅续费原有业务,还增购了星环科技的分布式关系型数据库、数据开发与智能分析工具,并在此基础上针对其业务需求特点购买了星环科技的数据应用解决方案,该客户2022年贡献的营收将大幅增长。目前,星环科技的客户复购率超过80%,这为其业务增长奠定了坚实的基础。

星环科技营收情况 数据来源:星环科技招股书推动国产大数据行业健康发展,为产业数字化保驾护航


作为国内大数据龙头企业,对推动行业的健康发展负有不可推卸的责任。孙元浩也将推动我国大数据产业的健康发展,作为星环科技的重要使命。在他看来,数字经济的核心是产业数字化,而大数据是产业数字化的重要基础。孙元浩认为,要推动大数据和数字经济的发展,需要从两方面着手:一方面,着力解决阻碍大数据产业健康发展的一系列问题,优化产业环境;另一方面,以更大力度推动大数据在重点行业中的应用落地,以先进的大数据技术推动产业数字化进程。目前,中国大数据行业还存在诸多问题,比如:大数据标准建设滞后,目前大数据领域的国标还处于草案阶段,行业标准受到厂商利益问题掣肘迟迟不能有效推进。接下来,我们要加快标准建设,避免重复造轮子,同时营造良好的产业发展环境,让“良币驱逐劣币”;开源社区的风险不可忽视。国内不少大数据厂商将技术寄托于开源社区,但开源社区存在国内厂商掌控力不足、话语权不够等问题,规则制定权主要掌握在美国企业手里,在极端情况下还存在“卡脖子”问题。因此,在有效利用开源社区的同时,也要注重核心技术的自研,避免对开源社区的过渡依赖。干事业,要两手抓,两手都要硬。一手抓问题解决,一手产业应用。一个产业的发展,最大的驱动力往往来自于市场需求。大数据产业的核心就是对数据的存储、计算、管理、分析,因而数据规模往往与大数据产业的市场规模成正相关。依据中国信息通信研究院、中国网络空间研究院的数据,近几年我国的数据量占全球的比例在持续提升。2017年到2021年,我国数据产量从2.3ZB增长至6.6ZB,全球占比9.9%,位居世界第二。此外,我国的大数据产业还拥有诸多得天独厚的优势。例如,截至2021年底,我国已建成142.5万个5G基站,总量占全球60%以上,5G用户数达到3.55亿户,远远超过欧美国家;我国IPv6 地址资源总量位居世界第一,IPv6 活跃用户数达 6.08 亿,同样远超欧美国家。

2017-2021 年我国数据产量及全球占比情况 来源:中国信息通信研究院、中国网络空间研究院在行业应用方面,我国是世界工厂,制造业的数字化转型需求巨大;光伏、风电、锂电等新能源发展全球领先,能源行业数字化前景广阔;我国以电动汽车为核心的新能源汽车产业走在全球前列,汽车电动化、软件定义汽车、自动驾驶、网联汽车的发展,会产生海量的数据,并催生大数据应用需求;中国智慧城市建设走在全球前列,遍布城市各个角落的智能摄像头每天都在产生巨量的数据,这也将催生巨大的数据处理需求。在政策层面,国家也在大力推动国产大数据的行业应用。国家提出“2+8+N”信创体系:两个核心行业,党政+金融;8大关键行业,电信、电力、石油、交通、教育、医疗、航空、航天;N个其他行业。这些领域的国产大数据行业应用需求将得到持续释放,市场潜力巨大。长期以来,人们似乎形成了一种固定的思维模式,那就是“外国的月亮更圆”——欧美国家的技术往往更加先进,商业模式更加领先,中国还处于学习和追赶阶段。但是,这个固有印象该改一改了。经过几十年的高速发展,在很多领域中国已经领先全球,至少不输国外同行。大数据作为一个新兴技术领域,全球都处于你追我赶的快速发展阶段,欧美国家的先发优势并不明显。并且,中国有发展大数据的良好“土壤”。更重要的是,中国的已经涌现出诸多优秀的国产大数据厂商,星环科技就是其中的典型代表。相信在各方的共同努力下,不仅国产大数据产业可以获得更快的发展,大数据作为关键基础设施在推动我国的产业数字化和数字经济建设方面,也将发挥更大的作用。

文:月满西楼 / 数据猿

《2022中国企业数智化转型升级服务全景图/产业图谱1.0版》

《2022中国数据智能产业图谱1.0版》

 创新服务企业榜

 创新服务产品榜

 最具投资价值榜

 创新技术突破榜

条漫:《看过大佬们发的朋友圈之后,我相信:明天会更好!》


联系数据猿

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存