CCF YOCSEF武汉举办观点论坛:“专库专用or大一统未来的数据库技术走向何方?”

 常见问题     |       来源:优游ub8平台    发布时间:2024-07-03 17:01:52

  2023年11月19日上午,CCF YOCSEF武汉“专库专用or大一统,未来的数据库技术走向何方?观点论坛在湖北省武汉市东湖新技术开发区未来科技城的武汉达梦数据库股份有限公司顺利举办。观点论坛由中国计算机学会(CCF)主办,CCF YOCSEF武汉学术委员会(YOCSEF武汉)和武汉达梦数据库股份有限公司(达梦数据库)协办。本次论坛由YOCSEF武汉委员冯源(武汉达梦数据库股份有限公司)与AC委员吴佳(北京联合伟世科技有限公司)担任执行主席,YOCSEF武汉AC委员刘芳(武汉城市学院)与委员汪蓉(北京华清远见教育科技集团)担任线上主席。来自华中科技大学、武汉大学、华中农业大学、湖北大学、江汉大学、武汉工程大学、武汉城市学院,以及达梦数据库、北京亿信华辰、上海赞奇文化科技、中国农业银行等高校与企业的专家学者,共计20余人参加了本次论坛。

  本次论坛在开始时,由武汉达梦数据库公股份有限公司的董事长冯裕才老师首先发表致辞。在致辞中,冯裕才老师深情回顾了达梦数据库从创立初期到如今的发展壮大所经历的辉煌历程,对于参加YOCSEF观点论坛活动的各位嘉宾,他表示了热烈的欢迎和衷心的感谢。紧接着,CCF YOCSEF武汉主席肖奎对YOCSEF的深厚历史和文化渊源进行了简明扼要的介绍。

  在引导发言环节开启之前,执行主席冯源和吴佳详尽地阐述了本次观点论坛的背景。他们提及了图灵奖获得者Stone Braker在2014年提出的著名观点——“One size does not fit all”,这一观点标志着数据库市场的一个重大转变。自此之后,分析型数据库、非结构化数据库、分布式数据库、向量数据库等产品逐渐崛起,使得传统的通用数据库市场被割裂为众多专用的细分市场。然而,与此同时,事务分析混合处理(HTAP)、多模数据库等技术也在学界和产业界中受到广泛关注,这些技术旨在实现数据库技术的大一统。当前,面临着专库专用与大一统两种理念的并存局面,这对用户的投资选型、产业的研发投入以及学界的前沿探索都产生了深远的影响。这一局面带来了巨大的挑战与机遇,同时也使得收益与代价难以衡量。为此,YOCSEF武汉特意组织此次观点论坛,旨在为我国的数据库学术和产业相关从业者提供一个启示性的“引子”。期望通过这次论坛,能为未来国内数据库产业的发展决策带来全面、客观的观点支持,助推我国数据库产业更健康、稳步的发展。

  首位引导发言嘉宾,吕韬专家,来自中国软件评测中心,为我们大家带来了题为《新技术、新需求驱动下的数据库产业现状分析》的精彩演讲。吕韬专家在发言中详细阐述了我国数据库产业的现状,并指出了一系列发展的新趋势。他提到,我国的数据库市场规模正在逐年攀升,应用领域也在逐步扩大。目前,我国已经有约200余款数据库产品,主要的关系型数据库企业的营收更是屡创新高。这显示出我国集中式关系型数据库正在从“可用”逐步向“好用”迈进。与此同时,新的AI技术和新硬件的迭代不仅带来了新的应用需求,也为数据库技术发展带来了新的特点:融合创新和专项深耕。在这些新的发展的新趋势下,数据库技术正展现出集群化、云化、智能化、多场景应用的崭新发展趋势。

  第二位引导发言嘉宾是来自武汉大学的王胜专家,他的演讲题目是《支持高效融合的多模数据库系统研究》。在这场演讲中,王胜专家深入探讨了数据库领域当前的研究热点和前沿技术。他引述《“十四五”大数据产业高质量发展规划》的指导精神,强调我们应该充分的发挥大数据的特性优势,强化数据的“多样性”处理,以促进多维度异构数据的关联。同时,也需要创新数据融合模式,提升多模态数据的综合处理水平,并通过数据的完整性来提高认知的全面性。王胜专家进一步讲解了多模数据库的分类,根据多模态数据的不同特点,将其分为关系模型、对象模型、键值模型、图模型等。他还通过研究多模态交通数据的融合存储,设计了多模态交通路线查询算法,成功实现了面向交通领域的多模态数据的有效处理。王胜专家的研究展示了多模数据库在高效融合和处理复杂数据方面的巨大潜力和应用价值。

  第三位引导发言嘉宾是来自南方电网数字电网集团的凌敏专家,他为我们大家带来了《能源行业国产数据库应用实践》的精彩演讲。凌敏专家详细阐述了国产数据库在电力行业的应用现状以及其重要性。他强调,当前,自主可控的信息系统软硬件平台慢慢的变成了能源行业网络安全建设的关键方向。在这一背景下,电网管理平台已经全面实现了基于全栈国产化的应用,大规模完成了国产数据库在电力控制、企业信息化、IT支撑平台等核心领域的替代工作。凌敏专家还指出,随着数据要素时代的到来,数据规模的爆发式增长对数据库技术提出了新的挑战。为了应对这些挑战,未来的数据库技术需要围绕“助力用户降本增效”、“护航数据要素安全流通”以及“赋能新兴业务场景”三个核心目标进行发展。这些发展趋势将确保数据库技术能够与时俱进,满足一直增长的数据处理需求,并推动能源行业等关键领域的持续进步。

  在思辨环节,执行主席冯源与吴佳简述了数据库发展历史。自上世纪70年代末,关系数据库逐渐成信息化建设的核心。90年代后,Oracle等公司形成“大一统”格局。尽管后来出现面向对象、原生XML等数据库技术,但均被通用关系型数据库厂商整合,市场反应平淡。2010年代后,大数据技术的兴起,驱动了列存、键值、宽列、文档、时序等数据库的涌现,直至2023年的新热点——向量数据库。这标志着“通用、全能”时代的结束,数据库市场进入“专库专用”的春秋战国时期。此阶段,不仅体现于数据模型上的区别,更涉及软件架构、业务负载特征、基础设施等层面的差异。然而,在新的技术趋势中,HTAP技术试图融合事务型和分析型负载,多模数据库技术则试图整合不同的数据模型,集中式-分布式一体化理念正在弥合两种架构间的差异。可见,数据库领域对于“大一统”的追求仍在继续。

  针对观点论坛的主题“专库专用or大一统,未来的数据库技术走向何方?”,首先邀请两位思辨嘉宾进行发言。

  来自华中科技大学的曹忠升表示:专库专用or大一统,是一个复杂的问题,由技术实现、科学规律、社会需求、产业需求构成。需求和技术产生了矛盾,追求本质和追求极致既统一又对立,数据库专库专用和大一统的发展的新趋势是递归迭代统一的过程。

  来自达梦数据库的胡书能表示:AI+物联网的深入发展进程中,业务需求越来越复杂,催生了各种各样适应不一样场景的不一样的数据库、不同的中间件。从用户层面看,大一统系统能不仅仅从数据库入手,可以同时从系统顶层入手;从企业角度看,满足市场需求是第一位,小而专的数据库产品和产品的组合是目前比较好的选择,但是在解决方向上也逐渐引入统一的技术和平台的解决思路。

  随后,与会人员在此基础上一同探讨了三个思辨问题,大家围绕“专库专用or大一统”这一核心问题,展开激烈的讨论。

  肖奎指出,技术的演进和迭代都源于用户的需求,并且客户的真实需求的差异性是客观存在的。因此,在选择专用数据库还是统一数据库时,我们应该根据用户的具体问题和规模来做出决策。王胜从学术的角度鼓励技术创新和高效融合,他认为专库和大一统数据库应该充分融合,以实现迭代创新。金正平则认为,从目前的情况来看,专库专用是更高效、成本可控的解决方案。张智勇从产业应用的角度出发,强调结合AI的应用,在用户体验和交互场景中,需要大量的多模态信息的加入,因此大一统的数据库更有利于满足场景应用和用户需求。最后,曹忠升提到了普通用户和数据库产业的不同需求,他认为从普通用户的角度来看,大一统的技术更容易接受;而从数据库产业的角度来说,专库专用在技术、适应场景和收益上具有明显优势。他还强调,从学术角度来看,专库专用在算法上可以有更独特的创新。因此,我们应该要依据不同的出发点和需求,来具体进行选择。这些观点提供了一个全面的视角,让我们更深入地理解专用数据库和统一数据库的选择与应用。

  王胜指出,尽管当前我们尚无法实现大一统系统,但我们需要持有创新的理念和梦想,拥抱大一统技术。从技术舒适区中跳脱出来,进入大一统技术的研究领域,是学术创新的必然要求。冯源则从硬件发展的角度出发,阐述了随着摩尔定律在CPU上的失效,数据库的瓶颈问题已从存储转移到了IO问题。他强调,专库和大一统所需的算力是不同的,因此从算力的角度选择专库或大一统可能成为一个值得探讨的问题。曹忠升进一步补充,在算力的迭代发展过程中,专库专用和大一统的问题仍然存在,这是一个相互影响、相互融合的发展过程。他提出,可以从数据库的数据模型、数据处理等方面进行统一,渐进实现一定程度的统一。胡书能则从产品整合的角度表示,技术上的大一统有不同的技术粒度和体现,将专用的技术通过一个大一统的上层接口提供给用户,是产品发展的极致目标。最后,张智勇强调各种技术并非相互割裂,而是可以使用大一统的思路进行有效的整合集成。这些观点共同揭示了在技术发展过程中,大一统与专库专用之间的复杂关系和潜在整合的可能性。

  思辨议题3:有限的职业生涯/投入经费中,能否避免“点错科技树”,或避免成为“先烈”?

  胡书能表示,作为行业企业,在面对新技术时,他们会从市场和用户的角度出发,以发展的眼光看待问题。他们会尝试进行少量的投入来拥抱新技术,并进行有效观察。在经过有效分析后,他们会决定后续的具体发展措施,以确保发展和投入都能以相对稳妥的进度进行。王胜则认为,高校可以在技术投入市场之前进行科学研究和试错,企业与高校之间可以有组织地进行科研合作,鼓励试错精神,并共同发展。冯源强调,在投入过程中存在各种不可控因素,因此需要从技术、资金、方向、数据等多个方面进行有效分析,以实现有效的风险控制。王胜还提到,在高校环境中,学校、导师、学生和政策制定者会进行深入讨论,提出风险预警和预案,以便进行综合选择。最后,刘志红表示,试错代表创新,是发展中不可或缺的进步方向。达梦的发展正是基于不断创新而实现的。在解决基础问题的同时,也要解决创新问题,这样既能建立良好的发展基础,又能实现有效创新、有效试错和有效控制风险。这些观点共同展现了在新技术投入和市场发展中,如何平衡创新、风险控制和稳健发展的综合考虑。

  1、技术的演进和迭代来源于用户需求,因此,在选择专用数据库还是统一数据库时,需要按照每个用户的具体问题和规模来做决策。专用数据库目前在效率和成本上具有优势,但在算力和硬件发展的背景下,大一统数据库可能更加有助于解决某些瓶颈问题和满足特定需求。

  2、从学术角度看,鼓励技术创新和高效融合,专库和大一统应该充分融合,迭代创新。高校可以在技术投入市场之前进行科学研究和试错,与企业合作,共同推动技术发展。

  3、在技术投入过程中,需要对各种不可控因素进行相对有效分析,以实现有效的风险控制,包括技术、资金、方向、数据等多个角度。试错代表创新,是发展中不可或缺的进步方向。在解决基础问题的同时,也要注重创新问题的解决,确保发展的稳定性和可持续性。

  此次论坛历时四个多小时,与会人员在激烈讨论中,围绕“专库专用 or 大一统,未来的数据库技术走向何方?”开展了深入思辨。本次论坛由中国计算机学会主办,CCF YOCSEF武汉分论坛、武汉达梦数据库股份有限公司协办。组织者感谢参会嘉宾的大力支持。

  特别提醒:本网信息来自于互联网,目的是传递更加多信息,并不代表本网赞同其观点。它的原创性以及文中叙述文字和内容信息没有经过本站证实,对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作一切保证或承诺,并请自己检查相关联的内容。本站不承担此类作品侵犯权利的行为的直接责任及连带责任。如若本网有任何内容侵犯您的权益,请及时联系我们,本站将会在24小时内处理完毕。