Web 即数据库

使用 AI 和 SQL 将任意授权网站完整精确转变成数据。现在,您可以直接在 Web 上应用商业智能。

开始 亚马逊全站数据

产品介绍

Web 即数据库

  • X-SQL - 架构在 Web 上的 SQL 引擎,Web 和本地数据库同等对待
  • 人工智能 - 人工智能驱动的自动网页挖掘技术,零干预或极少干预,超大规模网页完整精确还原为数据
  • 弹性计算 - 分布式网页渲染引擎满足任意规模的数据采集需求
  • 商业智能 - 在 Web 上应用商业智能,捕捉成千上万高价值事件,回答利益攸关的业务问题
-- 将一组亚马逊产品页转变成本地表
select
    dom_base_uri(dom) as `url`,
    dom_first_text(dom, '#productTitle') as `title`,
    str_substring_after(dom_first_href(dom, '#wayfinding-breadcrumbs_container ul li:last-child a'), '&node=') as `category`,
    dom_first_slim_html(dom, '#bylineInfo') as `brand`,
    cast(dom_all_slim_htmls(dom, '#imageBlock img') as varchar) as `gallery`,
    dom_first_slim_html(dom, '#landingImage, #imgTagWrapperId img, #imageBlock img:expr(width > 400)') as `img`,
    dom_first_text(dom, '#price tr td:contains(List Price) ~ td') as `listprice`,
    dom_first_text(dom, '#price tr td:matches(^Price) ~ td') as `price`,
    str_first_float(dom_first_text(dom, '#reviewsMedley .AverageCustomerReviews span:contains(out of)'), 0.0) as `score`,
from load_out_pages('https://www.amazon.com/b?node=3117954011', 'a[href~=/dp/]', 1, 10);
              
执行

智能挖掘

零干预将网站还原为数据

给定入口链接,柏拉图 AI 识别、浏览并解读最重要的链出页,输出全部字段:

select * from harvest('https://www.amazon.com/b?node=3117954011');

AI 已浏览120个网页,已理解8组数据共87个字段。 以下显示第2组数据,该组数据共包含10个字段,对应网页区域 #centerCol

  C1C2C3C4C5C6C7C8C9C10
1Amazon.com: BLACK+DECKER 6 quart 11-in-1 Cooking Pot, Stainless Steel, Pressure Cooker, Slow Cooker, Multi-Cooker, PR100 BLACK+DECKER 6 quart 11-in-1 Cooking Pot, Stainless Steel, Pressure Cooker, Slow Cooker, Multi-Cooker, PR100 by BLACK+DECKER4.2 out of 5 stars129 ratings | 89 answered questions + No Import Fees Deposit & ¥40.72 Shipping to Hong Kong New (5) from ¥54.17
2Amazon.com: BLACK+DECKER 6 quart 11-in-1 Cooking Pot, Stainless Steel, Pressure Cooker, Slow Cooker, Multi-Cooker, PR100 BLACK+DECKER 6 quart 11-in-1 Cooking Pot, Stainless Steel, Pressure Cooker, Slow Cooker, Multi-Cooker, PR100 by BLACK+DECKER4.2 out of 5 stars129 ratings | 89 answered questions + No Import Fees Deposit & ¥40.72 Shipping to Hong Kong New (5) from ¥54.17
3Amazon.com: Crock Pot 6 Quart 8 in 1 Multi Use Express Crock Programmable Pressure Cooker, Slow Cooker, Sauté & Steamer | Stainless Steel (SCCPPC60... Crock Pot 6 Quart 8 in 1 Multi Use Express Crock Programmable Pressure Cooker, Slow Cooker, Sauté & Steamer | Stainless Steel (SCCPPC600 V1) by Crockpot4.2 out of 5 stars2,086 ratings | 670 answered questions There is a newer model of this item: New (31) from ¥74.79
4Amazon.com: Crockpot Thermoshield 6 Quart Manual Slow Cooker, Black Crockpot Thermoshield 6 Quart Manual Slow Cooker, Black by Crockpot4.1 out of 5 stars150 ratings | 47 answered questions + No Import Fees Deposit & ¥47.40 Shipping to Hong Kong New & Used (12) from ¥59.99
5Amazon.com: GoWISE USA GW22637 4th-Generation Electric Pressure Cooker with rice scooper, and measuring cup, 14 QT GoWISE USA GW22637 4th-Generation Electric Pressure Cooker with rice scooper, and measuring cup, 14 QT by GoWISE USA3.9 out of 5 stars927 ratings | 498 answered questions + No Import Fees Deposit & ¥70.96 Shipping to Hong Kong New & Used (4) from ¥113.18
6Amazon.com: GoWISE USA GW22637 4th-Generation Electric Pressure Cooker with rice scooper, and measuring cup, 14 QT GoWISE USA GW22637 4th-Generation Electric Pressure Cooker with rice scooper, and measuring cup, 14 QT by GoWISE USA3.9 out of 5 stars927 ratings | 498 answered questions + No Import Fees Deposit & ¥70.96 Shipping to Hong Kong New & Used (4) from ¥113.18
7Amazon.com: GoWISE USA GW22637 4th-Generation Electric Pressure Cooker with rice scooper, and measuring cup, 14 QT GoWISE USA GW22637 4th-Generation Electric Pressure Cooker with rice scooper, and measuring cup, 14 QT by GoWISE USA3.9 out of 5 stars927 ratings | 498 answered questions + No Import Fees Deposit & ¥70.96 Shipping to Hong Kong New & Used (4) from ¥113.18
8Amazon.com: Gourmia GPC400 4 Qt Digital Multi-Mode SmartPot Pressure Cooker - 13 Cook Modes - Removable Pot - 24-Hour Delay Timer - Automatic Keep ... Gourmia GPC400 4 Qt Digital Multi-Mode SmartPot Pressure Cooker - 13 Cook Modes - Removable Pot - 24-Hour Delay Timer - Automatic Keep Warm - LCD Display - Pressure Sensor Lid Lock - Recipe Book by Gourmia4.2 out of 5 stars363 ratings | 171 answered questions + No Import Fees Deposit & ¥31.80 Shipping to Hong Kong   
9Amazon.com: Mealthy MultiPot 9-in-1 Programmable Pressure Cooker 6 Quarts with Stainless Steel Pot, Steamer Basket, instant access to recipe app. P... Mealthy MultiPot 9-in-1 Programmable Pressure Cooker 6 Quarts with Stainless Steel Pot, Steamer Basket, instant access to recipe app. Pressure cook, slow cook, sauté, rice cooker, yogurt, steam by Mealthy4.7 out of 5 stars1,593 ratings | 934 answered questions   New & Used (3) from ¥169.99
10Amazon.com: Ninja Instant, 1000-Watt Pressure, Slow, Multi Cooker, and Steamer with 6-Quart Ceramic Coated Pot & Steam Rack (PC101), Si, Black/Silver Ninja Instant, 1000-Watt Pressure, Slow, Multi Cooker, and Steamer with 6-Quart Ceramic Coated Pot & Steam Rack (PC101), Si, Black/Silver by Ninja4.7 out of 5 stars120 ratings | 65 answered questions This product is available as Renewed. New & Used (11) from ¥54.95
11Amazon.com: Power Pressure Cooker XL 10 Qt Power Pressure Cooker XL 10 Qt by Power Pressure Cooker XL4.1 out of 5 stars2,977 ratings | 1000+ answered questions + No Import Fees Deposit & ¥51.68 Shipping to Hong Kong New & Used (6) from ¥159.00
12Amazon.com: Presto 02141 6-Quart Electric Pressure Cooker, Stainless, Black, Silver Presto 02141 6-Quart Electric Pressure Cooker, Stainless, Black, Silver by Presto4.2 out of 5 stars54 ratings | 17 answered questions + No Import Fees Deposit & ¥38.45 Shipping to Hong Kong New & Used (33) from ¥59.99
执行

SAAS 服务

POST http://api.platonic.fun/api/x/a/q
Content-Type: application/json

{
  "sql": "select
    dom_base_uri(dom) as `url`,
    dom_first_text(dom, '#productTitle') as `title`,
    str_substring_after(dom_first_href(dom, '#wayfinding-breadcrumbs_container ul li:last-child a'), '&node=') as `category`,
    dom_first_slim_html(dom, '#bylineInfo') as `brand`,
    cast(dom_all_slim_htmls(dom, '#imageBlock img') as varchar) as `gallery`,
    dom_first_slim_html(dom, '#landingImage, #imgTagWrapperId img, #imageBlock img:expr(width > 400)') as `img`,
    dom_first_text(dom, '#price tr td:contains(List Price) ~ td') as `listprice`,
    dom_first_text(dom, '#price tr td:matches(^Price) ~ td') as `price`,
    str_first_float(dom_first_text(dom, '#reviewsMedley .AverageCustomerReviews span:contains(out of)'), 0.0) as `score`,
from load_out_pages('https://www.amazon.com/b?node=3117954011', 'a[href~=/dp/]', 1, 10);
",
  "callbackUrl": "http://{{host-of-your-callback-api}}/{{path-of-your-callback-api}}",
  "authToken": "fake-auth-gJn6fUBh-1-af1639a924d7232099a037e9544cf43f"
}
              

支持 X-SQL 的 REST API

  • 业务模型映射 - 使用 X-SQL 完成从网页数据到本地业务模型的转换
  • DATA API - 柏拉图的弹性计算使得规模化 Web 数据唾手可得
  • 高阶 SaaS 服务 - X-SQL 灵活的内置函数,提供进一步的数据处理能力:情绪判定,知识图谱构建等
  • 领域 SaaS 服务 - 对常见领域,柏拉图已内置开箱即用的解决方案
了解更多
50%

成本节约 相比传统方案,使用柏拉图管理外部数据,我们至少为客户减少了一半人员开支和一半硬件投入

20x

数据规模 基于柏拉图的机器学习技术,我们现在能够获得网站的几乎全部字段,并且再没有数据提取规则维护的烦恼

90%

交付时效 柏拉图简单在万维网上应用商业智能,相比传统手段的采集规则制定、采集入库、数据清洗、BI 报表流程, 交付时效提高 90% 以上

145%

数据质量 传统手工提取数据,大概能够获得极少量网站的 50% 左右字段,使用柏拉图前沿的数据挖掘技术,能够获得任意规模网站 95% 以上数据

解决方案

告诉我们您在进行何种类型的项目

价格情报

通过 Web 数据提取实现卓越的定价数据智能。

通过 Web 数据提取,通过高质量的定价数据智能定位产品并做出盈利决策。

电商选品

使用 Web BI 实现电商选品决策。

通过 Web BI,分析电商网站全站多维度数据,实现热卖和爆款商品预测。

渠道巡检

使用 Web BI 监测产品渠道,确保渠道合法合规。

使用 Web BI 监测产品渠道,确保渠道合法合规,渠道价格定价正确。

潜在顾客生成

使用高质量的 Web 提取数据构建高质量潜在客户列表。

构建目标客户列表,通过 Web 数据提取促进收入增长并生成智能潜在客户。

品牌监测

通过网络数据提取进行品牌监控,跟踪并保护您的品牌。

使用高质量和可靠的品牌和定价数据,确保您的品牌声誉在线受到保护。

招聘

通过网络数据提取,提供具有高质量人力资源和招聘数据的顶尖人才。

使用高质量的数据进行职位列表、应聘者来源、薪酬水平和市场洞察,以做出更好的招聘决策并吸引人才。

金融替代数据

使用高质量的金融 Web 数据做出利益攸关的决策。

利用来自 Web 的替代财务数据,在不断加速的市场中获取可操作的见解并做出明智的投资决策。

业务自动化

使用 Web BI 实现业务各个方面的自动化。

通过 Web 数据提取,实现业务内部流程的自动化,并在整个业务中快速移动数据。

构建产品

通过 Web 数据提取为数据驱动项目提供产品数据。

从 Web 中提取的高质量产品数据,可保持数据管道健康,让您专注于产品开发。

市场调查

通过 Web 数据提取创新您的市场调查。

借助高质量和可靠的市场数据,了解您的市场、提供研究,并随时了解趋势。

网络舆情

监测网络民情民意,为相关政府部门提供数据支撑。

利用来自新闻、论坛、贴吧、微博等来源的数据,为相关政府部门做出正确决策、舆情应对和政务实施提供数据支撑。

背景调查

使用 Web BI 和知识图谱,洞察人员背景,控制合作风险。

使用 Web BI 和知识图谱,洞察合作伙伴、谈判对手、重要嘉宾、求职者等人员的背景,以控制合作风险。

机器学习全部字段

select
    *
from
    harvest('https://www.amazon.com/b?node=3117954011')

百思买批量计算折扣

select
    dom_first_number(dom, '.priceView-customer-price') as `price`,
    dom_first_number(dom, '.pricing-price__regular-price') as `list-price`,
    dom_first_number(dom, '.pricing-price__regular-price') - dom_first_number(dom, '.priceView-customer-price') as `saving`
from
    load_out_pages('https://www.bestbuy.com/site/promo/laptop-and-computer-deals', 'h4.sku-header a')

京东手机价格监测

select
    dom_first_text(dom, '.p-name') as Name,
    dom_first_text(dom, '.p-price') as Price,
    dom_first_text(dom, '.p-commit a:last-child') as Reviews
from load_and_select('https://list.jd.com/list.html?cat=9987,653,655 -expires 1d', 'li[data-sku]')

亚马逊新品跟踪

select
    dom_first_text(dom, 'span.zg-item a > div:expr(img=0 && char>10)') as title,
    dom_first_text(dom, '.p13n-sc-price') as `price`,
    str_substring_between(dom_first_attr(dom, 'span.zg-item div a i.a-icon-star', 'class'), ' a-star-', ' ') as score
from load_and_select('https://www.amazon.com/gp/new-releases/home-garden/ref=zg_bsnr_nav_0', 'ol#zg-ordered-list li.zg-item-immersion')

客户评价

他们这么说 。。。

价格方案

选择最适合您的方案

免费版

¥0

  • 本地 API
  • X-SQL
  • Web BI
  • 浏览器支持
  • 机器学习
  • SaaS 服务
  • 分布式支持
  • 可选存储方案
  • 资源配置优化
  • 本地部署

企业私有云

¥10 ~ ¥100 万 / 年

  • 本地 API
  • X-SQL
  • Web BI
  • 浏览器支持
  • 机器学习
  • SaaS 服务
  • 分布式支持
  • 可选存储方案
  • 资源配置优化
  • 本地部署

团队介绍

张斌

总经理 & 创始人

姚尧

首席运营官

许飞龙

首席咨询师

褚雪忠

首席架构师

常见问题

柏拉图是如何实现自动网页结构化的?

柏拉图考察了网页的几何、拓扑、代码结构和语义等各方面的特征,将网页的每一个 DOM 元素建模为流形(manifold)上带属性的矩形,然后进行标准机器学习处理。

柏拉图由什么语言写成?

柏拉图解决方案包含多种编程语言。核心数据引擎的主要语言是 kotlin/java,少量 c++/javascript/bash/html/css 等,核心引擎超过 30 万行源代码。 配套子项目包含了 clojure/reactjs 等。

柏拉图是否支持开源?

是的,柏拉图核心引擎和 Web BI 系统均已经开源

可以使用哪些编程语言来获得柏拉图 SaaS 服务?

柏拉图解决方案提供标准的 SQL 语言支持以及 REST API,客户端各种编程语言都能够轻松调用,大多数情况下只需要简单发送一个 REST 请求即可。

柏拉图为什么要支持 SQL?

我们多年研究网络数据处理问题,希望以一种最优的方式去治理外部数据。将互联网同本地数据库同等对待是最佳方式。在后续版本里,柏拉图会支持流式 SQL,以完整符合网络数据的流式特征。

联系我们

柏拉图

加入柏拉图,开启企业级 Web 数据管理革命。

galaxyeye@live.cn

+86🌱186❧2153☙8660

Loading
Your message has been sent. Thank you!