Eliza Ibarra

Databricks

互联网 2024-12-21 02:04:25

Databricks,是属于 Spark 的商业化公司,由美国加州大学伯克利 AMP 实验室的 Spark 大数据处理系统多位创始人联合创立。Databricks 致力于提供基于 Spark 的云服务,可用于数据集成,数据管道等任务。

2013年,Databricks 成立,总部设在旧金山。 
2014年,Databricks 获得 3300 万美元的投资,当时推出了第一个产品 Databricks Cloud,这是一个通过将流程置于云端来简化大数据处理云平台。
2016年12月,大数据软件公司Databricks获得 6000 万美元 C 轮融资,由New Enterprise Associates 领投,Andreessen Horowitz 参投,本次投资有望帮助公司完成在数据的组织、计算和交付方面的一次跨跃。
2023年6月26日晚间,Databricks正式宣布,以约13亿美元收购生成式人工智能初创公司MosaicML,以提供为企业构建类ChatGPT工具的服务,交易预计将在今年7月31日前完成。 
2024年3月,Databricks推出一款通用大语言模型 DBRX,号称是“目前最强开源 AI”,据称在各种基准测试中都超越了“市面上所有的开源模型”。 
2024年12月18日,美国数据及人工智能(AI)公司Databricks宣布启动新一轮集资,目标是筹集到100亿美元资金。

Databricks 公司的云解决方案由三部分组成:Databricks 平台、Spark 和 Databricks 工作区。该产品背后的理念是提供处理数据的单独空间,不受托管环境和 Hadoop 集群管理的影响,整个过程在云中完成。该产品有几个核心概念:

由 Notebooks 提供一种与数据交互并构建图形的方法,当用户了解了显示数据的方式时,就可以开始构建主控面板以监视某些类型的数据。

最后,用户可以通过该平台的任务启动器来规划 Apache Spark 的运行时间。