Skip to content

Latest commit

 

History

History
118 lines (78 loc) · 2.89 KB

README.md

File metadata and controls

118 lines (78 loc) · 2.89 KB

使用方法(依赖docker)

git clone https://github.com/pythonstock/stock.git && sh stock/docker/startStock.sh

首先会下载相关镜像,然后在进行构建。启动mariadb,并讲stock和mariadb链接起来。

依赖这两个镜像,tensorflow镜像比较大。
docker.io/tensorflow/tensorflow:latest-py3
docker.io/mariadb:latest

访问端口:

http://localhost:9999 web

http://localhost:8888 jupyter

http://localhost:6006 tensorBoard

1,股票系统设计

股票数据抓取框架使用TuShare。 http://tushare.org/

数据分析清洗使用pandas,numpy。 http://pandas.pydata.org/

数据存储到磁盘上,使用Mysql数据库。存储股票数据。 https://pypi.python.org/pypi/mysqlclient

web框架使用tornado http://www.tornadoweb.org/en/stable/

机器学习,当然使用最流行TensorFlow啦。 https://www.tensorflow.org/

tornado web系统 http://docs.pythontab.com/tornado/introduction-to-tornado/

2,架构设计

全系使用python实现。因为都是python的类库,互相之间调用方便。 从数据抓取,数据处理,到数据展示数据运算都是python实现。

最终的数据都到前端展示出来。主要分为4个文件夹。

jobs 抓取数据并存储实现类。

libs 通用工具类。

web 前端展示框架。

tf 机器学习文件夹,推测数据。

3,应用部署

需要mysql数据库启动。项目放到/data/stock 目录。


    CREATE DATABASE IF NOT EXISTS `stock_data` CHARACTER SET utf8 COLLATE utf8_general_ci;

使用 :

http://docs.sqlalchemy.org/en/latest/core/reflection.html

3,web使用datatable显示报表

显示货币供应量: image

显示存款准备金率: image

4,使用pandas处理重复数据

https://pandas.pydata.org/pandas-docs/stable/generated/pandas.DataFrame.drop_duplicates.html

    data = ts.get_report_data(year, quarter)
    # 处理重复数据,保存最新一条数据。
    data.drop_duplicates(subset="code", keep="last")

5,增加多字段排序

1,点击是单个字段进行排序。

2,按照【shift】,点击多个,即可完成多字段排序。

3,服务端分页排序。

4,按照多个字段进行筛选查询。

image

6,增加对字典表通用修改

CREATE TABLE `user_stock` (
  `code` varchar(255) NOT NULL,
  `date` varchar(8) NOT NULL,
  `price` double DEFAULT NULL,
  `shares` double DEFAULT NULL,
  `commission_rate` double DEFAULT NULL,
  `tax_rate` double DEFAULT NULL,
  `comment` varchar(255) DEFAULT NULL,
  PRIMARY KEY (`code`)
) ENGINE=InnoDB DEFAULT CHARSET=utf8;