1.文件的读取
Pandas的文件输入有赖于xlrd、xlwt、openpyxl这三个第三方的库,如果读取失败可尝试先安装这几个库;
在数据分析的过程中对于数据的读取和写入是必不可少的,这里我们主要学习csv、 txt、 excel的读取和写入。
1.1文件的读取
csv、txt、excel文件分别可以使用read_csv()、read_table()、read_exece来读取,其中传入的参数都是文件的相对或者绝对路径。
其中的一些公共参数,header设置为None时表示第一行不作为列名,index_col表示把某一列或某几列作为索引;usecols表示读取列的集合,默认是所有的列;parse_dates表示需要转化为时间的列,nrows表示读取的数据行数。
header:
index_col:
usecol:
parse_dates:
nrows:
在读取txt文件的时候可能会遇到分隔符不是空格的情况,read_table()中是有一个分割参数sep,可以实现对分隔符号的自定义,sep中使用的是正则表达式。
2.数据的写入
通常使用to_csv()、to_excel()写入数据,如果想要快速的转化为markdown和latex可以使用to_markdown()、和to_latex(),但需要额外安装tabulate包。
一般情况下,pandas会在数据写入时包含当前的数据索引,但我们在输出的时候其实并不需要整数索引,此时可以将index设置为False,可以在输出时去掉索引。
pandas中没有定义to_table()函数,但是to_csv()可以将数据保存为txt文件,并且可以自定义分隔符。
页面更新:2024-05-31
本站资料均由网友自行发布提供,仅用于学习交流。如有版权问题,请与我联系,QQ:4156828
© CopyRight 2020-2024 All Rights Reserved. Powered By 71396.com 闽ICP备11008920号-4
闽公网安备35020302034903号