据官网最新消息,微软公布了SQL Server 2019的预览版。在这个预览版中,SQL Server不仅通过统一的图形和关系数据进行查询,还通过R和Python模型将机器学习带入数据库。随着数据量
据官网最新消息,微软公布了SQL Server 2019的预览版。在这个预览版中,SQL Server不仅通过统一的图形和关系数据进行查询,还通过R和Python模型将机器学习带入数据库。随着数据量和类型的增加,用户需要方便地整合和分析所有类型的数据,SQL Server 2019的目的就在这里。
虽然很多数据库都集成了Spark,但这对于微软来说绝对是有史以来的第一次。SQL Server 2019打造统一数据平台。其中,Apache Spark和Hadoop分布式文件系统(HDFS)与SQL Server打包在一起,成为一个集成的解决方案。通过增加大数据集群的能力,SQL Server 2019提供了令人难以置信的数据库管理功能扩展,进一步重新定义了SQL Server,完全超越了传统的关系数据库。与其他版本一样,SQL Server 2019通过智能查询处理、数据合规性工具和对持久内存的支持,继续突破工作负载的安全性、可用性和性能的界限。SQL Server 2019可以承担任何数据项目,从传统的SQL Server工作负载(如OLTP、数据仓库和BI)到AI和高级数据分析。
SQL Server提供了一个真正的混合平台,从数据中心到公共云都具有一致的表现形式,因此可以在任何地方轻松运行。由于SQL Server 2019大数据集群作为容器部署在Kubernetes上,并内置了管理服务,用户可以在本地和云上的各种支持平台上获得一致的管理和部署体验:OpenShift或Kubernetes、Azure Kubernetes Service (AKS)、Azure Stack(在AKS上)和Azure上的OpenShift。有了Azure Hybrid Benefit许可证和可移植性,用户可以选择在本地或Azure中运行SQL Server工作负载,而成本只是其他云提供商的一小部分。
SQL Server-洞察所有数据
SQL Server将继续开源,从在SQL Server 2017中支持Linux和容器,到在SQL Server 2019中拥抱Spark和HDFS,从而带来统一的数据平台体验。借助SQL Server 2019,数据分析所需的所有组件都将构建在托管集群中,这些集群易于部署,并且可以根据业务需求进行扩展。HDFS、Spark、Knox、Ranger、Livy与SQL Server打包在一起,并作为Linux容器快速轻松地部署在Kubernetes上。SQL Server通过消除结构化数据和非结构化数据之间的障碍,简化了所有企业数据的管理。
以下是全企业提供的数据视图,打破了数据实现洞察的壁垒:
简化SQL Server用户的大数据分析。SQL Server 2019使管理大数据环境变得更容易,提供了创建数据湖所需的一切,包括HDFS和Spark。它与SQL Server深度集成,并得到微软的全面支持。现在,用户可以在结构化和非结构化数据上运行应用程序,分析和使用人工智能功能。用户可以使用熟悉的T-SQL查询,熟悉Spark的用户也可以使用Python、R、Scala或Java运行Spark作业进行数据准备或分析,这些都集成在同一个集群中。用户可以选择他们喜欢的工具,为数据分析师和工程师提供所有数据(结构化和非结构化)的单一来源。借助SQL Server 2019,数据科学家可以通过Spark jobs轻松分析SQL Server和HDFS中的数据。分析师可以使用SQL Server机器学习服务对大数据运行高级分析:在Hadoop中训练大型数据集,在SQL Server中操作。数据科学家可以使用在Azure Data Studio扩展中的Jupyter notebook engine上运行的新笔记本体验,以交互方式执行数据的高级分析,并轻松地与他人共享分析结果。使用数据虚拟化打破数据孤岛,并提供所有数据的统一视图。从SQL Server 2016开始,PolyBase能够在SQL Server中运行T-SQL查询,从数据湖中提取数据并以结构化格式返回,所有这些都不需要移动或复制数据。现在,在SQL Server 2019中,我们正在将数据虚拟化的概念扩展到其他数据源,包括Oracle、Teradata、MongoDB、PostgreSQL等。借助新的PolyBase,我们可以使用虚拟化来分解数据孤岛,并轻松合并来自多个来源的数据,从而避免数据移动和复制所带来的时间、精力、安全风险和重复数据。新的可弹性扩展的“数据池”和“计算池”可以通过缓存数据和跨多个SQL Server实例分配查询执行来快速查询虚拟化数据。“从一开始,斯隆数字巡天数据库就一直运行在SQL Server上,其中还存储着天体目录。我们很高兴SQL Server 2019实现了其最初的大数据集群承诺,这将使我们能够增强数据库,以包含所有大数据集。SQL Server 2019的分布式特性使我们能够扩展新的模拟和下一代天文测量,数据集高达10PB或更多,远远超过我们当前数据库解决方案的限制。”–约翰霍普金斯大学数据密集型工程和科学博士。
增强的性能、安全性和可用性
SQL Server 2019引擎将在关键任务性能、安全性、合规性、数据库可用性、Linux上的SQL Server和容器以及通用引擎方面提供新的增强功能。
性能提升–智能数据库
智能查询处理系列功能基于SQL Server 2017中的自适应查询处理,包括行模式内存反馈,近似COUNT DISTINCT,行存储上的批处理模式和表变量延迟编译。此版本中的持久化内存支持得到改进,新的I/O优化路径可用于与持久性内存存储交互。现在,默认情况下启用轻量级查询分析基础结构,以便随时随地为每个查询运算符提供统计信息。
高级安全–加密计算
使用安全区域进行加密扩展了SQL Server 2016中引入的客户端加密技术。安全区域保护数据库内硬件或软件创建的安全区中的敏感数据,使其免受恶意软件和特权用户的攻击,同时对加密数据启用高级操作。SQL数据发现和分类内置于SQL Server引擎中,具有新的元数据和审计支持,可帮助满足GDPR和其他合规性需求。使用SQL Server配置管理器可以更轻松地进行认证管理。
关键任务的可用性–高可用性
在可用性方面增强,包括基于读/写意图自动重定向到主服务器的连接。可以使用Kubernetes的Always On Availability Groups启用在容器中运行的SQL Server高可用性配置。Resumable在线索引支持创建操作并包括数据库作用域默认值。
发展SQLGraph的增强功能包括对T-SQL MERGE和边缘约束的匹配支持。新的UTF-8支持使用户能够减少SQL Server字符数据存储空间。新的Java语言扩展允许调用预编译Java程序,并使用SQL Server在同一服务器上安全执行Java代码。通过使工作负载更接近数据实际所需空间,减少移动数据的需求并提高应用程序性能。MachineLearning Services具有多项增强功能,包括Windows故障转移集群支持,分区模型以及Linux上对SQL Server的支持。
平台选择
Linux上的SQL Server附加功能包括分布式事务、复制、Polybase、机器学习服务、内存通知和OpenLDAP支持。容器具有新的增强功能,包括使用支持RedHat Enterprise Linux映像的新Microsoft Container Registry和支持Kubernetes的Always On Availability Groups。
Azure Data Studio中的SQL Server 2019支持[/S2/]
SQL Server扩展了对更多数据工作负载的支持。随着微软与其数据平台用户的合作,我们可以看到许多不同于以前的角色:数据库管理员、数据科学家、数据开发人员、数据分析师以及其他正在定义的新角色。这些用户越来越希望使用相同的工具,跨内部和云无缝使用结构化和非结构化数据,并使用OLTP、ETL分析和流式工作负载协同工作。
Azure Data Studio通过闪电般的智能感知、源代码控制和终端集成,提供了现代化的编辑器体验。它以数据平台用户为设计理念,内置查询结果图表,集成笔记本和可定制仪表盘。目前,Azure Data Studio内置了对SQL Server内部部署和Azure SQL数据库的支持,以及对Azure SQL托管实例和Azure SQL数据仓库的预览支持。
Azure Data Studio发布了新的SQL Server 2019预览版扩展,添加了对选定的SQL Server 2019功能的支持。该扩展为SQL Server大数据集群提供了连接和工具,包括预览SQL Server工具的第一个笔记本体验,以及用于创建外部表的新PolyBase向导,该向导使远程SQL Server和Oracle实例数据可以轻松快速地访问。