博客
关于我
量化新手初识流数据表
阅读量:339 次
发布时间:2019-03-04

本文共 674 字,大约阅读时间需要 2 分钟。

研究量化交易时遇到一个概念:流数据表。

  • 流数据(data stream)

    流数据是一组顺序、大量、快速、连续到达的数据序列。由多个(数千个)数据源持续生成的数据。

    数据流可被视为一个随时间延续而无限增长的动态数据集合。

    应用场景:网络监控、传感器网络、航空航天、气象测控、金融服务…

    此类数据需要按记录或根据滑动时间窗口按顺序进行递增式处理,可以解析出网站点击量、人员和实物的地理位置…以便迅速对新情况做出反应。

  • 流数据数据源

    据华为分类,流数据普遍产生于四个方面:

    1. 日志
    2. 物联网
    3. 车联网
    4. StreamingML
  • 流数据与量化交易

    比较常用的量化交易策略框架是基于事件驱动。

    而事件驱动的本质正好与流数据相切和:迅速对新情况做出反应。

    本质上,事件驱动的量化处理的是证券市场产生的日志。

  • 实时流计算

    实时流,指计算框架按事件逐条实时处理,ono-by-one的数据流;

    计算,指数学计算、数据分析、算法模型执行;

    实时流计算,指实时处理当下正在发生的流数据,逐条大数据分析或运行机器学习算法。

    数据分析越及时,价值越大。

    在这里插入图片描述

  • 流式处理和批处理

    介绍流数据的文章都会提到流式处理和批处理的区别。

    流处理:
    1. 实时处理大数据,秒到毫秒的延迟
    2. Spark、Flink、Storm
    3. 对滚动事件窗口内的数据或仅对最近的数据记录进行查询或处理
    4. 数据大小:单挑记录或包含几条记录的微批量数据
    5. 针对简单的响应函数、聚合、滚动指标
    批处理:
    1. 几分钟、几小时甚至一天及以上
    2. 对数据集中的所有或大部分数据进行查询或处理
    3. 数据大小:大批量数据
    4. 针对复杂分析
  • References


转载地址:http://ixre.baihongyu.com/

你可能感兴趣的文章
vue项目配置文件vue.config.js中devServer.proxy 使用说明
查看>>
map的find函数和count函数
查看>>
C++并发与多线程(一)
查看>>
C++ 并发与多线程(五)
查看>>
STM32--USART串口收发数据
查看>>
逆合成孔径雷成像(一)— 傅里叶变换基础1
查看>>
elf格式静态链接和动态链接
查看>>
openthread编译错误:error: could not find ctags
查看>>
7628 EDCCA认证寄存器修改(认证自适应)
查看>>
C#四行代码写简易计算器,超详细带注释(建议新手看)
查看>>
计算机网络子网划分错题集
查看>>
java一些基本程序
查看>>
数据结构之排序
查看>>
数据结构经典十套卷之八
查看>>
修改jupyter保存文件目录
查看>>
tensorflow入门变量常量
查看>>
卷积神经网络六之CNN反向传播计算过程
查看>>
神经元与神经网络一之概述
查看>>
神经网络二之手写数字识别
查看>>
神经网络四之计算损失函数
查看>>