【python】pandas实现计算一列数据的平均值并输出

如果你有一个很长的数据集,需要计算其中某一列的平均值,可以试试这种方法:

目标:遍历文件夹中的所有xlsx文件,计算每个文件中某一列比如XXX列的平均值,并精确到小数点后两位,并将文件夹内所有文件的xxx列平均值和文件名导出到一个新的xlsx文件中并保存。

(更多…)

【python】pandas实现一阶差分计算并取绝对值

本算法的目标:基于python和pandas,遍历文件夹内所有xlsx文件。导入数据集,然后对数据集中的数据进行一个一阶差分的减法运算,具体就是将后一行数据减去前一行数据,得到一个取值(这样可以反映每一行数据的变化量),得到值之后可以按照需要给数据取绝对值。之后再导出为xlsx文件,单独保存成独立的新文件。
如果需要处理csv文件也是一样的方法,只不过读取的时候可以改成读取CSV文件。
本算法学习copilot写的算法并且经过自己修改之后使用,co写的有时候经常无法运行,需要进行一些细节修改。

必要的安装包:pandas

尤其是如果你的数据集中有非数字的数据,或者不希望进行处理的列,本方法可以帮助你避开不需要处理的列~实现运算。
(更多…)

python遍历文件夹excel并输出总行数的代码

如下所示,首先需要安装pandas和numpy以及openpyxl库

pip install pandas

pip install openpyxl

pip install numpy

然后通过运行下面这个算法,python就可以遍历整个文件夹下所有的xlsx文件或者xls文件,并通过pandas读取有多少行总数,并且进行输出。

这样便于对数据行数进行整理或者进行正态分布计算。

 

using System.Collections;
import os
import pandas as pd
import numpy as np


# 指定文件夹路径
folder_path = 'C:/Users/此处根据你自己的路径修改'
# 遍历文件夹下所有Excel文件
for filename in os.listdir(folder_path):
    if filename.endswith('.xlsx') or filename.endswith('.xls'):
        file_path = os.path.join(folder_path, filename)
        data = pd.read_excel(file_path,header=None)
        print(len(data)) # 输出行数