Replica Watches: Druid 0.17入门（4）—

2020-05-15

Druid 0.17入门（4）—— 数据查询方式大全

本文介绍Druid查询数据的方式，首先我们保证数据已经成功载入。

Druid查询基于HTTP，Druid提供了查询视图，并对结果进行了格式化。

Druid提供了三种查询方式，SQL，原生JSON，CURL。

一、SQL查询

我们用wiki的数据为例

查询10条最多的页面编辑

SELECT page, COUNT(*) AS EditsFROM wikipediaWHERE TIMESTAMP '2015-09-12 00:00:00' <= "__time" AND "__time" < TIMESTAMP '2015-09-13 00:00:00'GROUP BY pageORDER BY Edits DESCLIMIT 10

我们在Query视图中操作

会有提示

选择Smart query limit会自动限制行数

Druid还提供了命令行查询sql 可以运行bin/dsql进行操作

Welcome to dsql, the command-line client for Druid SQL.Type "\h" for help.dsql>

提交sql

dsql> SELECT page, COUNT(*) AS Edits FROM wikipedia WHERE "__time" BETWEEN TIMESTAMP '2015-09-12 00:00:00' AND TIMESTAMP '2015-09-13 00:00:00' GROUP BY page ORDER BY Edits DESC LIMIT 10;┌──────────────────────────────────────────────────────────┬───────┐│ page              │ Edits │├──────────────────────────────────────────────────────────┼───────┤│ Wikipedia:Vandalismusmeldung        │ 33 ││ User:Cyde/List of candidates for speedy deletion/Subpage │ 28 ││ Jeremy Corbyn           │ 27 ││ Wikipedia:Administrators' noticeboard/Incidents   │ 21 ││ Flavia Pennetta           │ 20 ││ Total Drama Presents: The Ridonculous Race    │ 18 ││ User talk:Dudeperson176123        │ 18 ││ Wikipédia:Le Bistro/12 septembre 2015     │ 18 ││ Wikipedia:In the news/Candidates       │ 17 ││ Wikipedia:Requests for page protection     │ 17 │└──────────────────────────────────────────────────────────┴───────┘Retrieved 10 rows in 0.06s.

还可以通过Http发送SQL

curl -X 'POST' -H 'Content-Type:application/json' -d @quickstart/tutorial/wikipedia-top-pages-sql.json { "page": "Wikipedia:Vandalismusmeldung", "Edits": 33 }, { "page": "User:Cyde/List of candidates for speedy deletion/Subpage", "Edits": 28 }, { "page": "Jeremy Corbyn", "Edits": 27 }, { "page": "Wikipedia:Administrators' noticeboard/Incidents", "Edits": 21 }, { "page": "Flavia Pennetta", "Edits": 20 }, { "page": "Total Drama Presents: The Ridonculous Race", "Edits": 18 }, { "page": "User talk:Dudeperson176123", "Edits": 18 }, { "page": "Wikipédia:Le Bistro/12 septembre 2015", "Edits": 18 }, { "page": "Wikipedia:In the news/Candidates", "Edits": 17 }, { "page": "Wikipedia:Requests for page protection", "Edits": 17 }]

二、原生JSON查询

Druid支持基于Json的查询

{ "queryType" : "topN", "dataSource" : "wikipedia", "intervals" : ["2015-09-12/2015-09-13"], "granularity" : "all", "dimension" : "page", "metric" : "count", "threshold" : 10, "aggregations" : [ {  "type" : "count",  "name" : "count" } ]}

把json粘贴到json 查询模式窗口

Json查询是通过向router和broker发送请求

curl -X POST '<queryable_host>:<port>/druid/v2/?pretty' -H 'Content-Type:application/json' -H 'Accept:application/json' -d @<query_json_file>

Druid提供了丰富的查询方式

Aggregation查询

Timeseries查询

{ "queryType": "timeseries", "dataSource": "sample_datasource", "granularity": "day", "descending": "true", "filter": { "type": "and", "fields": [  { "type": "selector", "dimension": "sample_dimension1", "value": "sample_value1" },  { "type": "or",  "fields": [   { "type": "selector", "dimension": "sample_dimension2", "value": "sample_value2" },   { "type": "selector", "dimension": "sample_dimension3", "value": "sample_value3" }  ]  } ] }, "aggregations": [ { "type": "longSum", "name": "sample_name1", "fieldName": "sample_fieldName1" }, { "type": "doubleSum", "name": "sample_name2", "fieldName": "sample_fieldName2" } ], "postAggregations": [ { "type": "arithmetic",  "name": "sample_divide",  "fn": "/",  "fields": [  { "type": "fieldAccess", "name": "postAgg__sample_name1", "fieldName": "sample_name1" },  { "type": "fieldAccess", "name": "postAgg__sample_name2", "fieldName": "sample_name2" }  ] } ], "intervals": [ "2012-01-01T00:00:00.000/2012-01-03T00:00:00.000" ]}

TopN查询

{ "queryType": "topN", "dataSource": "sample_data", "dimension": "sample_dim", "threshold": 5, "metric": "count", "granularity": "all", "filter": { "type": "and", "fields": [  {  "type": "selector",  "dimension": "dim1",  "value": "some_value"  },  {  "type": "selector",  "dimension": "dim2",  "value": "some_other_val"  } ] }, "aggregations": [ {  "type": "longSum",  "name": "count",  "fieldName": "count" }, {  "type": "doubleSum",  "name": "some_metric",  "fieldName": "some_metric" } ], "postAggregations": [ {  "type": "arithmetic",  "name": "average",  "fn": "/",  "fields": [  {   "type": "fieldAccess",   "name": "some_metric",   "fieldName": "some_metric"  },  {   "type": "fieldAccess",   "name": "count",   "fieldName": "count"  }  ] } ], "intervals": [ "2013-08-31T00:00:00.000/2013-09-03T00:00:00.000" ]}

GroupBy查询

{ "queryType": "groupBy", "dataSource": "sample_datasource", "granularity": "day", "dimensions": ["country", "device"], "limitSpec": { "type": "default", "limit": 5000, "columns": ["country", "data_transfer"] }, "filter": { "type": "and", "fields": [  { "type": "selector", "dimension": "carrier", "value": "AT&T" },  { "type": "or",  "fields": [   { "type": "selector", "dimension": "make", "value": "Apple" },   { "type": "selector", "dimension": "make", "value": "Samsung" }  ]  } ] }, "aggregations": [ { "type": "longSum", "name": "total_usage", "fieldName": "user_count" }, { "type": "doubleSum", "name": "data_transfer", "fieldName": "data_transfer" } ], "postAggregations": [ { "type": "arithmetic",  "name": "avg_usage",  "fn": "/",  "fields": [  { "type": "fieldAccess", "fieldName": "data_transfer" },  { "type": "fieldAccess", "fieldName": "total_usage" }  ] } ], "intervals": [ "2012-01-01T00:00:00.000/2012-01-03T00:00:00.000" ], "having": { "type": "greaterThan", "aggregation": "total_usage", "value": 100 }}

Metadata查询

TimeBoundary 查询

{ "queryType" : "timeBoundary", "dataSource": "sample_datasource", "bound"  : < "maxTime" | "minTime" > # optional, defaults to returning both timestamps if not set "filter" : { "type": "and", "fields": [<filter>, <filter>, ...] } # optional}

SegmentMetadata查询

{ "queryType":"segmentMetadata", "dataSource":"sample_datasource", "intervals":["2013-01-01/2014-01-01"]}

DatasourceMetadata查询

{ "queryType" : "dataSourceMetadata", "dataSource": "sample_datasource"}

Search查询

{ "queryType": "search", "dataSource": "sample_datasource", "granularity": "day", "searchDimensions": [ "dim1", "dim2" ], "query": { "type": "insensitive_contains", "value": "Ke" }, "sort" : { "type": "lexicographic" }, "intervals": [ "2013-01-01T00:00:00.000/2013-01-03T00:00:00.000" ]}

查询建议

用Timeseries和TopN替代GroupBy

取消查询

DELETE /druid/v2/{queryId}

curl -X DELETE " "error" : "Query timeout", "errorMessage" : "Timeout waiting for task.", "errorClass" : "java.util.concurrent.TimeoutException", "host" : "druid1.example.com:8083"}

三、CURL

基于Http的查询

curl -X 'POST' -H 'Content-Type:application/json' -d @quickstart/tutorial/wikipedia-top-pages.json id="四、客户端查询">四、客户端查询客户端查询是基于json的
具体查看 https://druid.apache.org/libraries.html
比如python查询的pydruid
from pydruid.client import *from pylab import pltquery = PyDruid(druid_url_goes_here, 'druid/v2')ts = query.timeseries( datasource='twitterstream', granularity='day', intervals='2014-02-02/p4w', aggregations={'length': doublesum('tweet_length'), 'count': doublesum('count')}, post_aggregations={'avg_tweet_length': (Field('length') / Field('count'))}, filter=Dimension('first_hashtag') == 'sochi2014')df = query.export_pandas()df['timestamp'] = df['timestamp'].map(lambda x: x.split('T')[0])df.plot(x='timestamp', y='avg_tweet_length', ylim=(80, 140), rot=20,  title='Sochi 2014')plt.ylabel('avg tweet length (chars)')plt.show()
实时流式计算整理了Druid入门指南
持续更新中~
更多实时数据分析相关博文与科技资讯，欢迎关注 "实时流式计算"
获取《Druid实时大数据分析》电子书，请在公号后台回复 "Druid"





Posted by



Replica Handbags




at

10:01:00 AM











Email ThisBlogThis!Share to XShare to FacebookShare to Pinterest




No comments:







Post a Comment




Newer Post


Older Post

Home

View mobile version





Subscribe to:
Post Comments (Atom)












Link


  Electronic Components distributor
  Connectors Distributor 
  IC Distributor 
  LED Distributor 
  Capacitor Distributor 
  Transistor Distributor 
  Electronic Components 
  Resistor Distributor 
  Diode Distributor
  IC Datasheet
  LED Datasheet
  Capacitor Datasheet
  Resistor Datasheet
  Connectors Datasheet
  Diode Datasheet
  Transistor Datasheet
   Datasheet
  IC  Datasheet
  Capacitor Datasheet
  Resistor Datasheet
  Diode Datasheet
  Transistor Datasheet
   Datasheet




Blog Archive








        ► 
      



2026

(819)





        ► 
      



June

(141)







        ► 
      



May

(154)







        ► 
      



April

(109)







        ► 
      



March

(129)







        ► 
      



February

(102)







        ► 
      



January

(184)









        ► 
      



2025

(1882)





        ► 
      



December

(182)







        ► 
      



November

(138)







        ► 
      



October

(132)







        ► 
      



September

(172)







        ► 
      



August

(159)







        ► 
      



July

(185)







        ► 
      



June

(184)







        ► 
      



May

(167)







        ► 
      



April

(167)







        ► 
      



March

(144)







        ► 
      



February

(150)







        ► 
      



January

(102)









        ► 
      



2024

(2302)





        ► 
      



December

(168)







        ► 
      



November

(131)







        ► 
      



October

(133)







        ► 
      



September

(213)







        ► 
      



August

(233)







        ► 
      



July

(267)







        ► 
      



June

(254)







        ► 
      



May

(264)







        ► 
      



April

(296)







        ► 
      



March

(160)







        ► 
      



February

(90)







        ► 
      



January

(93)









        ► 
      



2023

(2057)





        ► 
      



December

(175)







        ► 
      



November

(255)







        ► 
      



October

(152)







        ► 
      



September

(67)







        ► 
      



August

(108)







        ► 
      



July

(230)







        ► 
      



June

(246)







        ► 
      



May

(184)







        ► 
      



April

(117)







        ► 
      



March

(165)







        ► 
      



February

(183)







        ► 
      



January

(175)









        ► 
      



2022

(3954)





        ► 
      



December

(341)







        ► 
      



November

(390)







        ► 
      



October

(170)







        ► 
      



September

(182)







        ► 
      



August

(380)







        ► 
      



July

(379)







        ► 
      



June

(399)







        ► 
      



May

(353)







        ► 
      



April

(308)







        ► 
      



March

(435)







        ► 
      



February

(419)







        ► 
      



January

(198)









        ► 
      



2021

(2610)





        ► 
      



December

(102)







        ► 
      



November

(114)







        ► 
      



October

(118)







        ► 
      



September

(92)







        ► 
      



August

(87)







        ► 
      



July

(448)







        ► 
      



June

(481)







        ► 
      



May

(245)







        ► 
      



April

(181)







        ► 
      



March

(223)







        ► 
      



February

(209)







        ► 
      



January

(310)









        ▼ 
      



2020

(3580)





        ► 
      



December

(523)







        ► 
      



November

(490)







        ► 
      



October

(373)







        ► 
      



September

(344)







        ► 
      



August

(407)







        ► 
      



July

(413)







        ► 
      



June

(453)







        ▼ 
      



May

(369)

快递仓库暴发集体感染 900人确诊
Tiktok/抖音全球用户数据统计合集
2020年个人做亚马逊的9点建议
重磅！特朗普宣布：将取消香港特殊贸易地位！并将出台对华制裁措施！
市场需求大增、销售回暖！俄罗斯电商市场积极复苏
流量销量蹭蹭涨！一篇搞清亚马逊秒杀、七天促销、镇店之宝！
无底线恶搞何时停？广告被恶意点击，产品无端遭投诉！
刚刚！美国再次宣布，6月4日起对部分排除清单商品恢复加征25%关税
单例模式，反射破环？
卖家注意！亚马逊这些政策即将变更，6月15日生效
亚马逊新品上架要做些什么？上新基本流程一览！
速卖通618流量获取攻略：站外多场景投放 直通车资源升级
苏宁赚疯了！2.6欧买的欧洲豪门，4年暴涨N倍，已近10亿欧_国米
骨科医生：学会几个小动作，让你远离颈椎病
夜晚跑步减肥的正确方法，有7个小诀窍
海外仓和自贸仓哪种好？
Google Shopping Actions的亮点、入驻要求、申请方式、佣金费率和注意事项
亚马逊排名算法大变，BSR 排名一夜飙升到前50！
22种跨境电商常用工具
安卓到底是不是Linux
组装Json数据的一种简单办法(不用Stringbuilder方法)
注册通道6月30日关闭？未来将不接受卖家入驻？
惠氏大中华区换帅，继任者有跨境电商经验（内附视频）
亚马逊电商网站不稳定致约7.5万美国用户受影响
终于齐了！做跨境电商必知的工具网站大全
难上加难：亚马逊新账号注册改寄明信片了
怎样能实现一个月瘦30斤？先制定减肥计划
饭后减肥3大禁忌，别让小习惯毁身材
警惕！卖家被不良“服务商”上差评勒索敲诈，有人损失过万……
2020年做独立站必备工具合集
SpaceX首次载人发射推迟！为何天气能影响火箭发射？NASA飞船
只有女生拍照会摆 pose ？男生凹造型照样有样拍照凹造型型男
时尚博主们的新工作: 下场直播时尚博主
万万没想到 这个夏天给我种草阔腿裤的竟然是《创造营》阔腿裤遮肉显高
尽管抗议声不断 但米兰时装周负责人表示并不打算缩减日程时装周Gucci
宣美、泫雅、孙怡、乔欣中韩腿精大PK 你pick谁孙怡显高穿搭泫雅
新政！亚马逊更改类目排名规则，新品机会来了？
亚马逊的直播带货 还差点什么
corosync v1 + pacemaker高可用集群部署（二）资源配置(VIP+httpd+NFS)
亚马逊卖家，如何选择你的增长策略？
隔离期间浏览量增长了205%，家装品类迎来风口期
营收3年暴涨1500%！亚马逊澳洲站的好日子来临了！
疫情之下，亚马逊卖家该不该押宝Prime day?
面对移动端销量的增长，我们应有的Listing优化思考
亚马逊推出多渠道配送（MCF）费用计算器
Flink 流式聚合性能调优指南
背靠产业带 京喜助出口企业开辟下沉市场
VOVA运营选品  成功选品的第一步---跟卖需求
Scrum未完待续
WishPost部分物流渠道及路向价格调整（北京时间2020年6月1日生效）
今日《自然》重磅：中国科学家找到强效新冠中和抗体抗体中国科学家新冠肺炎
李铁今晚最大发现：25岁“国足关系户”对申花破门大爆发！_刘云
跨境电商企业财报拆解！环球易购亏26亿，兰亭集势上市7年首盈利！
物流加价无所遁形？！亚马逊最新费用计算器可预览多渠道配送成本
设计模式之工厂模式
Nginx 的过滤模块是干啥用的？
别怕吃米饭！这里有4大淀粉友善减重法
选品？听听站外怎么说
亚马逊28个运营必备知识及常见问题应对策略
Blazor WebAssembly 候选版迁移手记
Shopify主题选择过程中需要注意的几点事项
『曝光』深圳货代协会公布700多家货代企业黑名单
停售的listing被跟卖，亚马逊卖家该如何处理
月经期间排出血块？别慌，正常现象
日本肺癌5年生存率是中国的两倍！医生：预防肺癌，先做好三件事
吹空调引发多人发热，“祸首”化脓性链球菌可怕吗？
口罩厂大规模倒闭，吃口罩红利的那波卖家现在怎么样了？
重拳出击！亚马逊相关非法服务商被端！
算法分享之关于atcoderbeginner166E的讲解
国足归化一人恐成失败案例！媒体人：跟不上节奏，连中超都踢不了_洛国富
2020年亚马逊Prime Day 9月举行！
Starday这个机会你不要错过！
每天学习一个设计模式（二）：结构型之桥梁模式
Linux命令（15）lscpu命令
亚马逊广告怎么优化，这8条准则要牢记！
Etsy Payments业务将拓展至马来西亚等站点
日本将全面解除紧急事态宣言,重启后的日本电商市场
亚马逊新品流量扶持期的误区及应对方案
Instagram购物帖子的账号要求及创建步骤
亚马逊产品定价策略
电商大佬宣布关闭办公室！2020年这个趋势不可逆转
亚马逊Prime Day撞上返校季，双份流量要来了?
划重点！“两会”政府工作报告中外贸人需要特别关注的信息点汇总
SQL优化之SELECT COUNT(*)
缠腰龙（带状疱疹）缠一圈会要命？夏季高发，有这些症状当心了
这小玩意也爆发了！亚马逊今年有很多捡钱的机会
你的产品凭什么从亚马逊万千商品中脱颖而出？品牌开小灶利器了解一下！
亚马逊运营QA集锦（604-613）
老人长寿的秘密：懒！3件事“懒得做”，坚持一个月就会看到变化
30美金跌至12美金！美国站卖家大量清口罩库存
Lazada上传商品：精品店铺手动上传，这些步骤和细节要注意！
iOS开发Runtime 方法替换
选品中，你不得不知的优秀卖家全面复制法！
TikTok达人推荐！亚马逊上这个产品火了
Facebook组群的玩法，Facebook怎么玩，
好事连连！美国又发钱，亚马逊Prime day定了？
最全A+物流操作指南！注意，价格和尺寸都有调整
曼联提供5人任选交换大英天才，降低8000万天价！林加德或成筹码_格拉利什
越南政府预测2025年电商规模将达350亿美元
【VS】Visual Studio 就可以反编译查看源码了，再见了 Reflector
WishPost“智选”当红出道！5大物流项目到底有啥差别？
亚马逊疯狂上架自有品牌产品，跨境卖家还有活路，跨境卖家的出路在哪里，
孙杨被罚第84天，中国游泳另一巨星获顶级代言，网友：实至名归！_刘湘
如何给自己的产品选择合适的海外仓模式
亚马逊镇店之宝（DOTD）开启自助申报！Prime Day或将9月举行！
亚马逊又搞事？大面积listing变狗，有这些关键词的赶紧改
手把手教你如何选品！附案例教学
二审通关秘籍（建议收藏）
国羽小林丹横空出世！23岁天才不逊石宇奇，靠他阻击桃田贤斗？_林贵
Facebook重磅更新！扎克伯格宣布推出商店功能
矫枉过正？姐夫大面积狙杀卖家listing引众怒，菜鸟提升全球物流运力
庭院产品要爆！TikTok上热传！这个产品要特别关注了！
受疫情影响，亚马逊私有品牌卖家放慢了销售速度
除了亚马逊品牌注册，还有哪些方式可以抵抗假冒商品?
Linux命令（11）cd命令
公安部:不戴头盔处罚仅限于摩托车，2020年Prime Day将于8月举行！
盘点：亚马逊上不到10美元的20款爆款产品
Linux VMware centOS7 网络配置
投放Google Ads的几大致命误区，你犯了几个？
eBay：海外仓服务标准未达标的卖家帐号将受限或冻结
本地化成大趋势！跨境大卖都做了哪些本地仓储布局
国家外汇管理局支持贸易新业态 跨境电商政策迎利好
Facebook Shops正式上线，卖家可免费入驻
全球确诊超500万！外交部回应“美国制裁中国物流公司”，Facebook Shops正式上线
直击爆款，领取eBay 2020成交补贴福利
全球确诊超500万！外交部回应“美国制裁中国物流公司”，Facebook Shops宣布正式上线
丝芙兰入驻天猫国际，打造国内首个跨境电商线下品牌体验店
纯干货！最详尽的品牌授权流程_必须收藏的最完整品牌授权流程








        ► 
      



April

(208)









        ► 
      



2015

(583)





        ► 
      



June

(29)







        ► 
      



May

(151)







        ► 
      



April

(132)







        ► 
      



March

(76)







        ► 
      



February

(87)







        ► 
      



January

(108)









        ► 
      



2014

(1086)





        ► 
      



December

(125)







        ► 
      



November

(122)







        ► 
      



October

(89)







        ► 
      



September

(145)







        ► 
      



August

(148)







        ► 
      



July

(200)







        ► 
      



January

(257)









        ► 
      



2013

(3427)





        ► 
      



December

(263)







        ► 
      



November

(228)







        ► 
      



October

(217)







        ► 
      



September

(345)







        ► 
      



August

(406)







        ► 
      



July

(586)







        ► 
      



June

(480)







        ► 
      



May

(328)







        ► 
      



April

(95)







        ► 
      



March

(52)







        ► 
      



February

(196)







        ► 
      



January

(231)









        ► 
      



2012

(3571)





        ► 
      



December

(120)







        ► 
      



November

(201)







        ► 
      



October

(130)







        ► 
      



September

(300)







        ► 
      



August

(529)







        ► 
      



July

(513)







        ► 
      



June

(258)







        ► 
      



May

(274)







        ► 
      



April

(457)







        ► 
      



March

(293)







        ► 
      



February

(173)







        ► 
      



January

(323)









        ► 
      



2011

(727)





        ► 
      



December

(418)







        ► 
      



November

(2)







        ► 
      



August

(182)







        ► 
      



July

(77)







        ► 
      



January

(48)









        ► 
      



2010

(1435)





        ► 
      



December

(242)







        ► 
      



November

(273)







        ► 
      



October

(774)







        ► 
      



September

(146)



























Picture Window theme. Powered by Blogger.

2020-05-15

Druid 0.17入门（4）—— 数据查询方式大全

Druid 0.17入门（4）—— 数据查询方式大全

一、SQL查询

我们在Query视图中操作

Druid还提供了命令行查询sql 可以运行bin/dsql进行操作

还可以通过Http发送SQL

更多SQL示例

二、原生JSON查询

Aggregation查询

Timeseries查询

TopN查询

GroupBy查询

Metadata查询

TimeBoundary 查询

SegmentMetadata查询

DatasourceMetadata查询

Search查询

三、CURL

No comments:

Post a Comment