distinct
语法
distinct(X)
参数
X 是一个向量或数组向量类型。
详情
只返回向量 X 中不相同的元素,如果有两个或以上的相同元素,将只返回一个。结果中返回的顺序不保证和原来的向量相同。
例子
distinct 4 5 5 2 3;
# output
[3,2,5,4]
a = array(INT[], 0, 10).append!([1 2 3, 4 5, 6 7 8, 9 10])
distinct(a)
# output
[10,9,8,7,6,5,4,3,2,1]
t=table(3 1 2 2 3 as x);
select distinct x from t;
distinct_x |
---|
2 |
1 |
3 |
select sort(distinct(x)) as x from t;
x |
---|
1 |
2 |
3 |
函数 distinct
返回一个向量,而函数 set
返回一个集合。
x=set(4 5 5 2 3);
x;
# output
set(3,2,5,4)
x.intersection(set(2 5));
# output
set(2,5)
在内存表或分布式表中,distinct
函数可以和
group by
配合使用,每个分组的结果为一个数组向量。
dbName = "dfs://testdb"
if(existsDatabase(dbName)){
dropDatabase(dbName)
}
db=database("dfs://testdb", VALUE, 2012.01.11..2012.01.29)
n=100
t=table(take(2012.01.11..2012.01.29, n) as date, symbol(take("A"+string(21..60), n)) as sym, take(100, n) as val)
pt=db.createPartitionedTable(t, `pt, `date).append!(t)
result=select distinct(date) from pt group by sym
select sym, distinct_date from result where sym=`A21
sym | distinct_date |
---|---|
A21 | [2012.01.15,2012.01.13,2012.01.11] |