本文共 1181 字,大约阅读时间需要 3 分钟。
import pandas as pdImport numpy as np1.读取csv文件Filepath = ''Data = pd. read_csv(filepath, low_memory = False)2.输出设置pd.set_option('display.float_format', lambda x:'%f'%x) #display settingpd.set_option('display.height',1000)pd.set_option('display.max_rows',20)pd.set_option('display.max_columns',500)pd.set_option('display.width',1000)3.map函数#把data的列名全部变为大写Data.columns = map(str.upper, Data.columns)4.replace函数#将列名为‘Test’的这一列中,所有的0替换为NaNData['Test'] = Data['Test'].replace([0], np.nan)5.value_counts函数#Data['birds']这一列是各种鸟类。下面这一行会将各个种类的鸟统计个数,NaN也会被统计。Count_of_birds = Data['birds'].value_counts(sort = False, dropna = False)#Data['birds']这一列是各种鸟类。下面这一行会将各个种类的鸟统计百分比,NaN也会被统计。Count_of_birds = Data['birds'].value_counts(sort = False, normalize= True, dropna = False)6.lambda和apply#这里的apply函数是将function_name应用于所有的行,类似对于列。Data['weight'] = Data.apply(lambda row: function_name (row), axis = 1)7.条件筛选#选出Data中符合条件的行数据或列数据。与或关系要弄清。New_data = Data[condition1 | condition2 & condition3 ]8.新建一个pd数据#'C1'等是列名,c1,c2等是数据。New_data = pd.DataFrame({'C1': c1, 'C2': c2, 'C3': c3})
更多学习资料,请关注下面的公众号:不定期分享
来自 <>
转载地址:http://nyjrj.baihongyu.com/