字典
概述
字典是一种容器类型,包含唯一的键值对列表。其中:
-
键必须是标量。键支持的数据类型为Integral类(compress除外)、Temporal类、Floating类和Literal类。值可以是任何数据形式与数据类型。
-
键可以增加,但不可更新;值可以更新。
字典分为无序字典与有序字典两种类型。无序字典在输出或进行遍历时,其键值对不保留输入时的顺序;有序字典在输出或进行遍历时,键值对的顺序与输入顺序保持一致。DolphinDB 内置函数所返回的字典一般为有序字典,如使用 transpose 对表转置后的输出、JSON 字符串解析输出、机器学习模型输出,以及各类统计信息输出的字典。
有序字典和无序字典对各类函数的支持情况:
| 函数类型 | 无序字典 | 有序字典 | |
|---|---|---|---|
| 单目函数 | 标量函数 | 支持 | 支持 |
| 向量函数(常规及 cum/m 系列) | 支持 | 支持 | |
| 聚合函数 | 支持 | 支持 | |
| 双目函数 | 标量函数 | 支持,另一个参数只能是字典或标量 | 支持 |
| 向量函数(常规及 cum/m 系列) | 支持,另一个参数只能是字典或标量 | 支持 | |
| 聚合函数 | 支持 | 支持 | |
-
对于非向量函数,始终按行操作字典:即将把每个 key 对应位置的元素组成一行,再逐行应用函数。
-
对于向量函数,可以按行或按列操作字典,其行为由配置项 processVectorFunctionOverTupleByRow 控制:
-
true(默认):按行操作,即将把每个 key 对应位置的元素组成一行,再逐行应用函数。
-
false:按列操作,即将每个 value 向量视为一列,函数分别作用于各列。
-
创建字典
用函数 dict 或 syncDict 创建一个字典,其中X表示键,Y表示值,参数 ordered 控制是否创建有序字典。dict 函数创建的字典不允许并发读写,syncDict 函数创建的字典允许并发读写。
x=1 2 3 1;
y=2.3 4.6 5.3 6.4;
z=dict(x, y);
//注意重复键1的存在
z;
3->5.3
2->4.6
1->6.4
//当有重复键存在时,其值以最后一个值为准。
z=dict(y, x);
z;
6.4->1
5.3->3
4.6->2
2.3->1
$z=dict(y,x,true)
$z;
2.3->1
4.6->2
5.3->3
6.4->1
//创建有序字典,键的输出顺序与输入顺序一致
也可用指定数据类型的键和值来创建空字典,然后在字典中插入(键, 值)数据对。
// 创建一个空字典,其键类型是整数,值类型是双精度浮点。
z=dict(INT,DOUBLE);
// 插入一个新元素,1是键,7.9是值。
z[1]=7.9;
z;
1->7.9
// 更新值
z[1]=6.3;
z;
1->6.3;
z[-1]=1000;
z;
-1->1000
1->6.3```
我们可以用函数 dict (string, any)来创建一个值为不同数据类型的字典。
z=dict(STRING,ANY)
z[`IBM]=172.91 173.45 171.6
z[`MS]=29.11 29.03 29.4
z[`SECOND]=10:30:01s 10:30:03s 10:30:05s
z[`TOTAL]=3
z;
SECOND->[10:30:01,10:30:03,10:30:05]
MS->[29.11,29.03,29.4]
TOTAL->3
IBM->[172.91,173.45,171.6]
访问字典
x=3 6 1 5 9
y=4.2 3.7 8.8 6.4 5.3
z=dict(x, y)
z;
9->5.3
5->6.4
1->8.8
6->3.7
3->4.2
keys z;
[9,5,1,6,3]
// 取得一个字典的所有键
values z;
[5.3,6.4,8.8,3.7,4.2]
// 取得一个字典的所有值
size z;
5
z[9];
5.3
z[5 3];
[6.4,4.2]
z.3;
4.2;
z.(3 5);
[4.2,6.4]
x=dict(`IBM`GOOG`MSFT, (1 2 3, 4 5 6, 7 8 9));
x;
MSFT->[7,8,9]
IBM->[1,2,3]
GOOG->[4,5,6]
x[`IBM`MSFT];
([1,2,3],[7,8,9])
x[`IBM`MSFT,1 2];
([2,3],[8,9])
也可使用函数 find 来获得某个键对应的值。
find(z,1 3);
[8.8,4.2]
z find 5;
6.4
find(z, 7 3);
[,4.2]
//7不是z中的键,因此返回NULL。
修改字典
我们可以用语句Z[X]=Y来更新或追加一个字典。如果键存在于字典中,那么该语句会更新对应的值;否则它会向字典Z添加一个新的键值对。另一个更新字典的方法是 dictUpdate! 函数。
// 更新字典z
z[1]=9.2
z[3 5]=4.3 6.5
z;
9->5.3
5->6.5
1->9.2
6->3.7
3->4.3
// 增加新的键值到字典z
z[2]=5
z;
2->5
9->5.3
5->6.5
1->9.2
6->3.7
3->4.3
// 下面这条语句执行失败,是因为z.2只有只读权限访问键2的值。
z.2=5;
Syntax Error: [line #1] Please use '==' rather than '=' as equal operator in non-sql expression.
x=dict(1 2 3, 1 1 1);
x;
3->1
1->1
2->1
// 用函数dictUpdate!更新字典
dictUpdate!(x, add, 2 3, 1 2);
3->3
1->1
2->2
x.dictUpdate!(mul, 3 4, 2 4);
4->4
3->6
1->1
2->2
函数 erase! 用于删除一个键值;函数 clear! 用于清空所有键值。
x=1..3
y=4..6
z=dict(x,y);
z;
3->6
1->4
2->5
z.erase!(3);
1->4
2->5
z.clear!();
z;
有序字典支持和等长的数组进行二元操作。输出一个字典,键不变,值为原字典值与数组进行二元操作后的结果。
x=`a `d `c `b;
y=2.3 4.6 5.3 6.1;
z1=dict(x, y,true);
z2= 1 1 1 1
z1+z2;
// output
a->3.3
d->5.6
c->6.3
b->7.1
检索字典
用函数 in 在字典里检索某个键值。
x=1..3
y=4..6
z=dict(x,y);
1 in z;
1
10 in z;
0
字典到表的转换方法
将一个字典转置为表
通过 transpose 函数可以将字典转置为表,更多转换规则请参考函数页面。
将简单字典转置为表:
d=dict(`sym`val,[`a`b`c,1 2 3]);
d;
/*
val->[1,2,3]
sym->[a,b,c]
*/
transpose(d);
| val | sym |
|---|---|
| 1 | a |
| 2 | b |
| 3 | c |
将嵌套字典转置为表:
d = {'tag1':{'val1':2,'val2':6},'tag2':{'val2':1, 'val3':3}}
d
/*
tag1->
val1->2
val2->6
tag2->
val2->1
val3->3
*/
transpose(d)
|
key |
val1 |
val2 |
|---|---|---|
| tag1 | 2 | 6 |
| tag2 | 1 |
将多个字典合并为表
高阶函数 each 结合函数 asis 可以将多个字典合并为表。
合并后的表结构由第一个字典确定,表的列名对应该字典的键,每行的数据来自于字典中该键对应的值。如果某个字典中缺少某个键,表中该位置的值将为 NULL。
下例中,合并后的表由 d1 的键 key1、key2、key3、key4 构成;d2 中不包含 key1,故合并后的表对应值为 NULL。
d1 = {'key1':10,'key2':"A1",'key3':0.15,'key4':[1,2,3]}
d1
/*
key1->10
key2->A1
key3->0.15
key4->[1,2,3]
*/
d2 = {'key2':"B1",'key3':0.16,'key4':[2,4,6,8],'key5':12}
d2
/*
key2->B1
key3->0.16
key4->[2,4,6,8]
key5->12
*/
asis:E([d1,d2])
| key1 | key2 | key3 | key4 |
|---|---|---|---|
| 10 | A1 | 0.15 | [1, 2, 3] |
| B1 | 0.16 | [2, 4, 6, 8] |
关于性能
-
整数键值性能最佳。
-
基于向量的操作有利于发挥字典的性能,例如用一个向量访问一个字典。
-
取得所有的键值需要扫描整个字典。
