registerSnapshotEngine
语法
registerSnapshotEngine(dbName, tableName, keyColumnName)
参数
dbName 是一个字符串,表示分布式数据库的名称。
tableName 是一个字符串,表示分布式表的名称。
keyColumnName 是一个字符串,表示分组列的名称。
详情
为分布式表注册一个快照引擎。快照引擎将分布式表按照 keyColumnName 指定的列分组,获取每个组的最新记录。注册快照引擎后,我们可以通过 select [HINT_SNAPSHOT] * from loadTable(dbName,tableName) 来获取每个分组的最新记录。
使用 unregisterSnapshotEngine 函数可以取消注册快照引擎。
注:
-
该功能目前只能在单实例模式下运行。
-
一个分布式表只能注册一个快照引擎。
-
系统重启后,需要重新注册快照引擎。
例子
创建分布式表:
db1=database("",VALUE,2018.09.01..2018.09.30)
db2=database("",VALUE,`AAPL`MSFT`MS`C)
db=database("dfs://compoDB",COMPO,[db1,db2])
t=table(1:0,`date`sym`val,[DATE,SYMBOL,DOUBLE])
pt=db.createPartitionedTable(t,`pt,`date`sym);
注册快照引擎来获取分布式表 pt 中每个股票代码对应的最新记录。
registerSnapshotEngine("dfs://compoDB","pt","sym");
写入数据,获取每个股票代码对应的最新记录。本例使用的是随机生成的数据,因此执行的结果有可能会与本例的结果不同。
def writeData(batch){
pt=loadTable("dfs://compoDB","pt")
tmp=table(batch:0,`date`sym`val,[DATE,SYMBOL,DOUBLE])
dates=take(2018.09.01..2018.09.30,batch)
syms=take(`AAPL`MSFT`MS`C,batch)
vals=rand(100.0,batch)
insert into tmp values(dates,syms,vals)
pt.append!(tmp)
}
writeData(1000);
select [HINT_SNAPSHOT] * from loadTable("dfs://compoDB","pt");
date | sym | val |
---|---|---|
2018.09.29 | AAPL | 24.945753 |
2018.09.29 | MS | 14.034453 |
2018.09.30 | C | 3.89175 |
2018.09.30 | MSFT | 17.720025 |
writeData(1000);
select [HINT_SNAPSHOT] * from loadTable("dfs://compoDB","pt");
date | sym | val |
---|---|---|
2018.09.29 | AAPL | 86.296883 |
2018.09.29 | MS | 48.17885 |
2018.09.30 | C | 83.7821 |
2018.09.30 | MSFT | 44.415456 |