博客
关于我
量化新手初识流数据表
阅读量:340 次
发布时间:2019-03-04

本文共 674 字,大约阅读时间需要 2 分钟。

研究量化交易时遇到一个概念:流数据表。

  • 流数据(data stream)

    流数据是一组顺序、大量、快速、连续到达的数据序列。由多个(数千个)数据源持续生成的数据。

    数据流可被视为一个随时间延续而无限增长的动态数据集合。

    应用场景:网络监控、传感器网络、航空航天、气象测控、金融服务…

    此类数据需要按记录或根据滑动时间窗口按顺序进行递增式处理,可以解析出网站点击量、人员和实物的地理位置…以便迅速对新情况做出反应。

  • 流数据数据源

    据华为分类,流数据普遍产生于四个方面:

    1. 日志
    2. 物联网
    3. 车联网
    4. StreamingML
  • 流数据与量化交易

    比较常用的量化交易策略框架是基于事件驱动。

    而事件驱动的本质正好与流数据相切和:迅速对新情况做出反应。

    本质上,事件驱动的量化处理的是证券市场产生的日志。

  • 实时流计算

    实时流,指计算框架按事件逐条实时处理,ono-by-one的数据流;

    计算,指数学计算、数据分析、算法模型执行;

    实时流计算,指实时处理当下正在发生的流数据,逐条大数据分析或运行机器学习算法。

    数据分析越及时,价值越大。

    在这里插入图片描述

  • 流式处理和批处理

    介绍流数据的文章都会提到流式处理和批处理的区别。

    流处理:
    1. 实时处理大数据,秒到毫秒的延迟
    2. Spark、Flink、Storm
    3. 对滚动事件窗口内的数据或仅对最近的数据记录进行查询或处理
    4. 数据大小:单挑记录或包含几条记录的微批量数据
    5. 针对简单的响应函数、聚合、滚动指标
    批处理:
    1. 几分钟、几小时甚至一天及以上
    2. 对数据集中的所有或大部分数据进行查询或处理
    3. 数据大小:大批量数据
    4. 针对复杂分析
  • References


转载地址:http://ixre.baihongyu.com/

你可能感兴趣的文章
js:虚拟dom与diff算法
查看>>
计算机系统原理——cachelab 实验1(第一周)
查看>>
JAVA初窥-DAY07
查看>>
数组--Go语言学习笔记
查看>>
Redis (三)——Linux 上安装 Redis
查看>>
Redis踩坑(1)-----配置文件redis.conf修改后不生效问题
查看>>
从零带你学习Go语言:23、 Go指针 、切片、 map、 结构体复习
查看>>
广东iOS企业开发者签名有没有好的推荐?
查看>>
iOS企业签名掉签会提前知道的么?
查看>>
苹果企业签名首要考虑的真的是价格因素么?别傻了
查看>>
关于scanf函数在VS中使用的问题
查看>>
操作符初识
查看>>
c编程常见错误-函数声明没有参数类型声明
查看>>
Dialog篇
查看>>
概率论 贝叶斯公式
查看>>
数据挖掘 如何做 Python数据分析与挖掘实战
查看>>
java 重写(override)和重载(overload)区别
查看>>
java 多态
查看>>
java 多态类型转换
查看>>
java ==和equals
查看>>