金融量化之Tushare模块

2024-07-29 20:39:19

一、介绍

Tushare是一个免费、开源的python财经数据接口包。主要实现对股票等金融数据从数据采集、清洗加工 到 数据存储的过程，能够为金融分析人员提供快速、整洁、和多样的便于分析的数据，为他们在数据获取方面极大地减轻工作量，使他们更加专注于策略和模型的研究与实现上。考虑到Python pandas包在金融量化分析中体现出的优势，Tushare返回的绝大部分的数据格式都是pandas DataFrame类型，非常便于用pandas/NumPy/Matplotlib进行数据分析和可视化。当然，如果您习惯了用Excel或者关系型数据库做分析，您也可以通过Tushare的数据存储功能，将数据全部保存到本地后进行分析。应一些用户的请求，从0.2.5版本开始，Tushare同时兼容Python 2.x和Python 3.x，对部分代码进行了重构，并优化了一些算法，确保数据获取的高效和稳定。

需要强调的是，TuShare库里不仅仅有股票数据，而是一个综合的财经库。只是因为股票数据数据量比较大，特别锻炼数据分析能力，所以才选择股票数据练手。其余的数据也是很有意思的，比如全国电影票房排名

使用前提

安装Python
安装pandas
lxml也是必须的，正常情况下安装了Anaconda后无须单独安装，如果没有可执行：pip install lxml

建议安装Anaconda（http://www.continuum.io/downloads），一次安装包括了Python环境和全部依赖包，减少问题出现的几率。

下载安装

方式1：pip install tushare
方式2：访问https://pypi.python.org/pypi/Tushare/下载安装

版本升级

pip install tushare --upgrade

查看当前版本的方法：

import tushareprint(tushare.__version__)

二、Tushare的应用

1、概念

1.K线：K线起源于日本德川幕府时代，因为图形像蜡烛，所以又称蜡烛图，日本线。K线是代表这一天股票的开盘价，收盘价，最高价和最低价。

2.均线：均线一般分为5日(MA5)，10日(MA10)，20日(MA20)，30日(MA30)，60日(MA60)，120日(MA120)和250日平均线(MA250)，它指的是在这些天里这个股票收盘的平均价格，通过K线与均线的对比可以看出股票的强弱，一般在5日均线以上属于较强势。

2、获取股票行情的函数

我们主要还是应该掌握如何用tushare获取股票行情数据，使用的是ts.get_hist_data()函数或者ts.get_k_data（）函数

参数：

code：股票代码，即6位数字代码，或者指数代码（sh=上证指数 sz=深圳成指 hs300=沪深300指数 sz50=上证50 zxb=中小板 cyb=创业板）start：开始日期，格式YYYY-MM-DDend：结束日期，格式YYYY-MM-DDktype：数据类型，D=日k线 W=周 M=月 5=5分钟 15=15分钟 30=30分钟 60=60分钟，默认为Dretry_count：当网络异常后重试次数，默认为3pause:重试时停顿秒数，默认为0返回值说明：date：日期open：开盘价high：最高价close：收盘价low：最低价volume：成交量price_change：价格变动p_change：涨跌幅ma5：5日均价ma10：10日均价ma20:20日均价v_ma5:5日均量v_ma10:10日均量v_ma20:20日均量turnover:换手率[注：指数无此项]

3、案例

import pandas as pdimport numpy as npfrom pandas import DataFrame,Seriesimport tushare as ts# 获取k线数据，加载至DataFrame中df = ts.get_k_data('600519',start='2000-01-01')  # 茅台df.head()# 将从Tushare中获取的数据存储至本地df.to_csv('./maotai.csv')# 将原数据中的时间作为行索引，并将字符串类型的时间序列化成时间对象类型# index_col参数：把某一列col作为行索引index# parse_dates:把字符串类型的时间序列化成时间对象类型df = pd.read_csv('./maotai.csv',index_col='date',parse_dates=['date'])df.drop(labels='Unnamed: 0',axis=1,inplace=True)df.head()# 分析1：输出该股票所有收盘比开盘上涨3%以上的日期# 获取满足条件的行索引df.loc[(df['close'] - df['open'])/df['open'] > 0.03].index# 分析2：输出该股票所有开盘比前日收盘跌幅超过2%的日期df.loc[(df['open'] - df['close'].shift(1)) / df['close'].shift(1) <= -0.02].index# 分析3：假如我从2010年1月1日开始，每月第一个交易日买入1手股票，每年最后一个交易日卖出所有股票，到今天为止，我的收益如何price_last = df['open'][-1]df = df['2010-01':'2019-01'] # 剔除首尾无用的数据# Pandas提供了resample函数用便捷的方式对时间序列进行重采样，根据时间粒度的变大或者变小分为降采样和升采样：df_monthly = df.resample("M").first()  # 获取每月第一个交易日对应的行数据df_yearly = df.resample("Y").last()[:-1] # 获取每年第最后一个交易日对应的行数据并去除最后一年cost_money = 0hold = 0 # 每年持有的股票for year in range(2010, 2020):        cost_money -= df_monthly.loc[str(year)]['open'].sum()*100    hold += len(df_monthly[str(year)]['open']) * 100    if year != 2019:        cost_money += df_yearly[str(year)]['open'][0] * hold        hold = 0 # 每年持有的股票cost_money += hold * price_lastprint(cost_money)

4、双均线策略

概念

金叉：就是指短期的均线向上穿越中期或长期的均线，交点就为金叉，应该买入。
死叉：就是指短期的均线向下穿越中期或长期的均线，交点就为死叉，应该卖出。
其它指标以此类推

"""如果我从假如我从2010年1月1日开始，初始资金为100000元，金叉尽量买入，死叉全部卖出，则到今天为止，我的炒股收益率如何？(双均线策略)"""import tushare as tsimport pandas as pdimport numpy as npfrom pandas import DataFrame,Series# 获取k线数据，加载至DataFrame中df = ts.get_k_data('600519',start='2000-01-01')# 将从Tushare中获取的数据存储至本地df.to_csv('./maotai.csv')# 将原数据中的时间作为行索引，并将字符串类型的时间序列化成时间对象类型# index_col参数：把某一列col作为行索引index# parse_dates:把字符串类型的时间序列化成时间对象类型df = pd.read_csv('./maotai.csv',index_col='date',parse_dates=['date'])df.drop(labels='Unnamed: 0',axis=1,inplace=True)# 获取需要的数据df = df['2010':'2019'] # 计算均线ma5 = df['close'].rolling(5).mean()  # 5日均值ma30 = df['close'].rolling(30).mean()  # 30日均值# 计算出金叉和死叉s1 = ma5 < ma30s2 = ma5 > ma30

# 计算金叉死叉图解

gold = df.loc[~(s1 | s2.shift(1))].index  # 金叉dead = df.loc[s1&s2.shift(1)].index  # 死叉# 计算出结果first_money = 100000money = first_moneyhold = 0  # 持有多少股sr1 = Series(1, index=gold)  # 把所有金叉点组成一个行索引为金叉日期，值为1的Series数组sr2 = Series(0, index=dead)  # 把所有死叉点组成一个行索引为死叉日期，值为0的Series数组# 合并金叉死叉，并根据时间排序sr = sr1.append(sr2).sort_index()for i in range(0, len(sr)):    p = df['open'][sr.index[i]]  # sr.index取到Series索引，sr.index[i],第i个索引    if sr.iloc[i] == 1:        # 金叉        buy = (money // (100 * p))        hold += buy*100        money -= buy*100*p    else:        money += hold * p        hold = 0        p = df['open'][-1]now_money = hold * p + moneyprint(now_money - first_money)

一行pandas代码生成哑变量

一. 数据 import pandas as pd df = pd.read_csv('data.csv', usecols=['Name', 'Info']) df.head() 二.任务现在我想 ...
如何用Python中Tushare包轻松完成股票筛选（详细流程操作）

如何用Python中Tushare包轻松完成股票筛选(详细流程操作) 本文包括安装以及调用Tushare包的详细流程操作一.Tushare简介 Tushare是Python中一个十分好用的免费调用股 ...
「Python量化」股票涨停板探索性分析与数据挖掘

D1 引言从系统论的角度来看,股票市场是一个复杂系统,市场的涨跌是由资金流(市场资金存量.流入量.流出量)和回路(市场信息与交易者行为形成的各种反馈.调节.增强回路)非线性作用下的结果.换句话说,牛 ...
python对股市进行数据分析-tushare篇

数据准备 TuShare是一个免费.开源的python财经数据接口包.主要实现对股票等金融数据从数据采集.清洗加工到数据存储的过程,能够为金融分析人员提供快速.整洁.和多样的便于分析的数据,为他们 ...
基于Python获取股票分析，数据分析实战

基于Python获取股票分析，数据分析实战
一起学习Python常用模块——pandas

作者介绍 @王多鱼百度的一名推荐算法攻城狮. 主要负责推荐的召回和排序模型的优化工作. 1 前言 Pandas 是Python的一个数据分析包,它是为了解决数据分析任务而创建的.Pandas 纳入了 ...
Pandas 使用教程

Pandas 基础使用教程(1) Pandas 是非常著名的开源数据处理库,我们可以通过它完成对数据集进行快速读取.转换.过滤.分析等一系列操作.除此之外,Pandas 拥有强大的缺失数据处理与数据透 ...
AI人工智能、机器学习在金融量化投资领域的应用

余文鑫 ArivnAI量化对冲基金Quantitative hedge funds,欢迎自荐与合作,电话(微信) 18682408004,邮箱arvin.yu@jrjhr.com-发布日期: 2020 ...
突破置换模块计算瓶颈，MSRA开源轻量版HRNet，超越主流轻量化网络！｜CVPR2021

作者丨happy 审稿丨邓富城编辑丨极市平台极市导读本文从HRNet与轻量化网络ShuffleNet的组合出发,针对置换模块存在的计算瓶颈问题,提出了一种高效条件通道加权单元替换1x1卷积,并得 ...
金融杠杆的量化、跟踪与测算（联讯证券李奇霖、钟林楠）

联讯证券董事总经理.首席宏观研究员李奇霖(执业编号:S0300517030002) 联讯证券研究院宏观组钟林楠在<中国杠杆全解析>中,我们详细介绍了居民杠杆.企业杠杆与政府杠杆的来龙去 ...
量化基金20万美金年薪岗位招聘要求：需大部分时间混迹各大社交网站千万不要受过金融高等教育！

随着Reddit网站上WallStreetBets论坛的散户投资者证明了自己在股票市场的强大力量,一些专业投资公司正试图"招安"他们. 根据总部位于纽约的量化基金Cindicato ...
【量化】seaborn在金融数据可视化中的应用

<python与量化投资从基础到实战>学习笔记tips:如果没时间阅读,可收藏本文或者直接滑动到文末获取本项目代码下载链接 seaborn库是以matplotlib为基础,同时支持nump ...
金融科普：量化与交易领域最重要的十本参考书

打开量化投资的黑箱这本书的作者里什·纳兰(Rishi K. Narang)是华尔街顶级数量金融专家,资深对冲基金经理,自1996年开始,他就开始从事对冲基金事业,专注于量化交易策略.目前是特雷西斯资 ...
美研金融工程、金融数学、量化金融的申请问答

本文共包括11个大问题,分别回答如下: 01 转专业申请金融工程专业需要什么前置课程? 一般需要一些数学课程,比如微积分,线性代数的知识,然后需要修一些编程课,比如C语言之类的,金融类课程不是特别关键 ...
量化交易：001-python读取tushare股票清单

import pandasimport tushare as ts #在python中安装tushare库的方法: pip install tushare#首先到tushare网站去免费注册用户后,会 ...
数据分析到量化投资实战全攻略，推荐使用免费的财经数据tushare

数据分析到量化投资实战全攻略，推荐使用免费的财经数据tushare