Pandas是Python的一个开源数据分析库,提供了高性能、易用的数据结构和数据分析工具。它特别适合处理和分析结构化数据,如CSV、Excel等格式的文件。
Pandas是一个强大的Python数据分析库,它提供了大量用于处理和分析数据的功能,以下是一些基本的Pandas操作:
(图片来源网络,侵删)
1、导入pandas库:
import pandas as pd
2、创建一个DataFrame:
data = {'Name': ['Alice', 'Bob', 'Charlie'], 'Age': [25, 30, 35], 'City': ['New York', 'San Francisco', 'Los Angeles']} df = pd.DataFrame(data)
3、查看DataFrame的前几行:
print(df.head())
4、选择DataFrame的某一列:
ages = df['Age']
5、选择DataFrame的多列:
selected_columns = df[['Name', 'City']]
6、根据条件筛选DataFrame:
filtered_df = df[df['Age'] > 30]
7、对DataFrame进行排序:
sorted_df = df.sort_values(by='Age')
8、计算DataFrame的统计信息:
(图片来源网络,侵删)
summary = df.describe()
9、添加新的列到DataFrame:
df['Salary'] = [50000, 60000, 70000]
10、删除DataFrame中的列:
df = df.drop('City', axis=1)
这只是Pandas的基础操作,实际上Pandas还有很多高级功能,如分组、合并、透视表等,要深入了解Pandas,建议参考官方文档或相关教程。
(图片来源网络,侵删)
声明:本站所有文章,如无特殊说明或标注,均为本站原创发布。任何个人或组织,在未征得本站同意时,禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益,可联系我们进行处理。
评论(0)