“可视化方法论” v.s “数据库方法论”
图数据应用的双生伙伴
当下,随着技术的不断成熟,越来越多的用户开始了解并尝试使用图数据作为数据应用工作流中的一部分。为了更好地应用图数据,对图结构数据具有原生支持能力的图数据库(如Neo4j、Tiger Graph、Nebula Graph等)应运而生。依托于图数据库,用户便可实现对图数据的直接存储、查询、运算以及基于此的高阶应用开发,如各类图算法、图机器学习、图人工智能等。可惜的是,单独围绕图数据库的图数据应用模式(数据库方法论)具有抽象、使用难度高、数据源与数据结构支持有限、无法用于分享与汇报等问题;这限制了用户基于图数据库挖掘图数据价值的潜力,并因此遏制了图技术为人类社会与经济发展所能作出的贡献。幸运的是,图客通过其跨世代交互式三维数据可视化分析平台-GraphXR,提出并引领了与图数据应用“数据库方法论”独立却又相辅相成的“GraphXR可视化方法论”,即通过GraphXR对不同来源、不同结构的数据进行更直观、更易于上手且支持分享与汇报的图可视化探索与分析,并可结合图数据库实现更具深度与广度的图数据应用工作流。只有当图数据应用的“数据库方法论”与“可视化方法论”相结合,“图”的真正价值才能被释放。
事实上,我们可以清晰地发现数据库方法与可视化方法(GraphXR)在各自优势与劣 势上存在明显的互补性。数据库方法抽象的使用体验、较高的上手难度、有限的数据结构与数据源支持,以及匮乏的数据分享能力可以被图可视化解决方案有效化解;同时,以可视化切入的图应用所具有的较差图算法支持以及较少可用数据等问题亦可被图数据库完美化解。当用户需要进行直观、高效且具备分享能力的图数据应用时,可视化方法可为上策;反之,当用户需要进行富有深度与精度、所需数据量庞大且与图数据科学有关的图应用时,则可优先选择数据库方法。此外,数据可视化工具亦可与图数据库进行深度兼容,以支持用户直接通过可视化工具对图数据库中的数据进行读取与写入,借此彻底打破数据库方法与可视化方法的边界,为用户真正带来完整、流畅且高效的图数据应用体验。只有当数据库方法与可视化方法相结合,“图”的价值才可能真正被释放!
海量数据的存储能力
当人们讨论到图数据库,最先想到的往往便是其海量数据的存储能力。作为数据应用的根本基础设施,(图)数据库的数据存储能力关乎所有相关行业参与者的价值创造与挖掘能力。幸运的是,当前图数据库所支持数据量的上限正随着不断发展的技术飞速增长。曾经数百万/数千万节点即可被认为是海量数据的时代已经一去不复返;动辄万亿乃至百万亿节点的存储支持可有效解决用户图数据应用的数据量焦虑。
高性能的图查询能力
光有海量数据的存储能力并不能帮助用户高效实现心目中理想的图数据应用。与图存储 能力相似,图查询能力作为图数据应用的底层需求,亦需被有效保障,以实现用户对于图数据库中数据的高效交互并完成具体的应用落地,如银行交易信息的快速查询、修改与写入等。当前,大部分图数据库均支持对大量数据的高性能查询,而这也成为了图数据库技术普及的重要推动力之一。
对复杂图算法以及图人工智能与图机器学习的支持
依托于图数据库的运算能力,结合存储于其中的海量图数据,用户便可通过图结构数据 特有的图算法来挖掘数据价值,如寻找中心数据、发掘最短路径或是探测社群等。同时,用户也可进一步进行基于图结构数据的人工智能应用研发与机器学习模型训练,借此进一步提升图数据应用价值。
数据库方法的优势
—
抽象的数据模型
使用体验
在图数据库中,用户在围绕数据模型进行数据整理、运算与分析时,往往只能通过表格或二维图谱可视化等可展示信息量与灵活性受限的手段对数据模型进行提取,再将所获得的信息在大脑中根据个人对所参考数据模型的理解进行重组,以推进数据相关工作流。即便该类抽象的数据模型使用方式非常普遍,其缺陷也不该被忽视,即由于人类思维本身的不稳定性(如易受情绪影响)导致的工作结果可靠性下降,以及对工作人员抽象思考数据模型能力的较高要求;这些弊端阻碍了图数据库作为图应用基础设施的价值,也提高了图数据库用户应用图数据的成本。
使用难度
较高
除了使用体验较为抽象外,使用难度较高也是当前图数据库面临的问题之一,而导致该 问题的首要因素,便是用户必须学习图数据库的专用查询语言来对图数据库中进行操作。令人遗憾的是,当前图数据库行业内并没有统一的查询语言标准;即使由图数据库Neo4j倡导的Open Cypher图查询语言在当下较为流行,各图数据库主要厂家依然在努力争夺图数据领域的查询语言话语权,而这也间接造成了用户学习图查询语言成本的进一步上升。
有限的数据源和数据结构支持
顾名思义,图数据库之所以被称为是图数据库,便是因其专注于为图结构数据提供原生 存储、查询与运算能力;这份专注为图数据库开拓了全新的应用场景,却也限制了图数据库在应用领域的灵活性。用户已经投入的大量非图结构数据应用资产(如关系型数据库等)往往无法被很好地用来支持图数据应用。同时,由于限制于图结构,图数据库也无法很好地帮助用户对除图数据之外的不同结构数据进行应用,比如关联分析等。
有限的分享与汇报能力
作为专注于提供图数据存储及相关技术支持的基础设施,图数据库在图数据的分享与汇 报上往往具有局限性,这与图数据对数据之间关系的原生支持性质有冲突,因为当用户具备能直接查询数据之间关系的能力,他们便会在好奇思维的驱使下或主动、或被动地进行图探索,而其中发现的各类内涵便天然具备被分享的价值。事实上,“图”本身作为与人类思维和自然万事万物发展规律高度契合的数据结构,其核心价值来源之一便是高度的可解释性,而这也从根本上提升了用户对图分享和图汇报的需求。
数据库方法的劣势
—
直观的使用体验
数据可视化之所以被人类应用至今且不断发展,核心原因便是其化繁为简,帮助人们更直观、更高效理解抽象信息或概念的能力。图作为与人类思维模式高度契合的数据结构,其可视化也极易被人脑所理解。基于此特性,通过图可视化进行图数据探索、分析与应用将具备数据库方法无法比拟的泛用性。任何人都可以通过直观的图可视化快速感受图中的数据内涵,而图客GraphXR在此基础之上做了极大延伸,真正赋予用户极高的灵活性以帮助用户快速理解图、探索图、分析图与分享图,借此感受图、挖掘图、享受图。
下限低、上限高的使用门槛
与图数据库强调应用查询语言(Query Language)的使用方式不同,由于图客GraphXR 专注于提升人用图数据分析的使用体验,为了让更多人能进行图分析,在GraphXR当中所有操作(如导入数据、读取数据、数据转换、数据分享等)均可通过可视化操作界面进行处理。基于此,GraphXR在不强制用户对复杂多变的查询语言进行学习的前提之下,帮助用户快捷地进行与图相关的各种数据操作。这为用户节约了大量学习成本,也因此帮助更多人接触与感受图的魅力。当然,若用户已熟练掌握某种图查询语言(如Cypher),GraphXR亦支持用户直接使用查询语言进行复杂且精确的图操作,借此更快一步达成图数据应用目的。
综合的数据结构与数据源支持
与专注于提供图结构数据相关服务的图数据库不同,为了更好地迎合行业现状与用户需 求,帮助已经投入大量资源运营与维护非图结构数据的个人与企业组织充分利用现有数据资产,图客GraphXR强调以可视化切入图应用,并因此支持各类不同的数据结构与数据源。不论是结构化数据还是非结构化数据,不论是表格、文档、图片还是视频,图客GraphXR均可帮助用户直观完成数据的可视化关联,并进一步推进接下来的数据建模、探索、分析与汇报工作流。
原生的图数据分享与汇报能力
依托于数据可视化对人们理解概念与事物效率的提升以及图结构数据对于数据之间关 联的原生支持,通过可视化方法切入的图应用往往具备极强的分享与汇报能力;用户可直观、高效地对可视化的图模型进行分享,并快速将背后的数据内涵与逻辑传递给他人,而针对这一特性,图客GraphXR亦作了极强的优化。用户可通过将GraphXR项目分享给他人以实现多人协作数据可视化应用。同时,用户亦可直接屏幕截图对感兴趣的二维图可视化模型进行快速分享,或是通过GraphXR自带的强大GIF生成工具对精细的三维图模型进行编辑、下载与分享,借此实现全方位的图数据分享与汇报。
GraphXR可视化方法的优势
—
较弱的图算法支持
由于底层技术与逻辑的差异,图数据可视化工具往往不具备单独作为计算平台支持图算法的能力。即使强如GraphXR,亦仅支持主流图算法(如最短路径、中心性、网页排名等)的日常使用,而无法支持动态、精准且不断发展的图算法库(如Neo4j的Graph Data Science Library),这为对图应用有极精细要求且具备图数据科学能力的用户实现基于先进图算法的图应用提出了挑战。
有限的节点数量支持
与图数据库对动辄几百上千亿节点与边的支持不同,由于数据可视化渲染对客户端性能 的要求,目前图数据可视化工具普遍无法支持同时流畅可视化几万个数据节点(几万条边);即使强大如GraphXR,亦仅支持不超过10万个节点(性能版不超过100万个节点)的流畅可视化分析。这限制了用户通过可视化切入需要对海量数据进行操作的图应用,如全图遍历分析等。同时,当可视化的“节点+边”数量达到数万个,从整体上对图进行可视化分析与应用的效率将大打折扣,用户将无法高效获取洞见,这也限制了可视化方法对人用数据探索与分析支持的“宽度”。
GraphXR可视化方法的劣势
—
“数据库方法论”与“GraphXR可视化方法论”相结合-图数据应用的终极解决方案
—
图客B站
图客知乎
图客小红书
图客公众号
图客头条号