创作新主题

社区所有版块导航

Python

python开源 Django Python DjangoApp pycharm

DATA

docker Elasticsearch

问与答闲聊招聘翻译创业分享发现分享创造求职区块链支付之战

aigc

aigc chatgpt

WEB开发

linux MongoDB Redis DATABASE NGINX 其他Web框架 web工具 zookeeper tornado NoSql Bootstrap js peewee Git bottle IE MQ Jquery

机器学习

机器学习算法

Python88.com

反馈公告社区推广

产品

短视频

印度

一周十大热门主题

10年顽疾ChatGPT一眼识破！AlphaGo时刻震撼全球医疗界

多邻国联姻瑞幸；if椰子水母企IPO市值冲上100亿；阿里巴巴美国站推B2B先买后付 | TopDi...

时代命题下的民营科技担当：从备份战略看Gitee的国家定位

ChatGPT诞生内幕大曝光！发布前一晚还在纠结

7月27日开考！人社部能建中心《生成式人工智能（AIGC）技术应用》职业培训

专访上海电气品牌公关总监张笛：从“人带人闯市场”到全球品牌，大国重器的出海进化论 | TopDigi...

Nginx和Apache要成旧爱了？PHP有了新搭档：缝合怪FrankenPHP！

#OpenAI近两年大事回顾##ChatGPT进化史#OpenA-20250703130735

Altman 嘲讽 Meta 挖走的不是顶尖人才，OpenAI 高管首曝内幕：ChatGPT 如何让...

Ilya尘封10年录音曝光！大二入Hinton门下，竟坦言机器学习反直觉

关注

Py学习 » Python

如何在python中跳过读取CSV文件的第一行?

Atish Banerjee • 5 年前 • 4143 次点击

我要求Python打印CSV数据列中的最小值,但是最上面的行是列号,我不希望Python考虑最上面的行。如何确保Python忽略第一行?

这是目前为止的代码:

import csv

with open('all16.csv', 'rb') as inf:
    incsv = csv.reader(inf)
    column = 1                
    datatype = float          
    data = (datatype(column) for row in incsv)   
    least_value = min(data)

print least_value

你能解释一下你在做什么,而不仅仅是给出代码吗?我对Python很陌生,我想确保我理解所有内容。

Python社区是高质量的Python/Django开发社区
本文地址：http://www.python88.com/topic/51949

4143 次点击

文章 [ 14 ] | 最新文章 5 年前

• 1 楼

Christophe Roussy 8 年前

巨蟒3.X

处理UTF8物料清单+标题

令人沮丧的是 csv 模块无法轻松获取头文件,UTF-8bom(文件中的第一个字符)也有一个错误。这对我来说很管用 csv公司 模块:

import csv

def read_csv(self, csv_path, delimiter):
    with open(csv_path, newline='', encoding='utf-8') as f:
        # https://bugs.python.org/issue7185
        # Remove UTF8 BOM.
        txt = f.read()[1:]

    # Remove header line.
    header = txt.splitlines()[:1]
    lines = txt.splitlines()[1:]

    # Convert to list.
    csv_rows = list(csv.reader(lines, delimiter=delimiter))

    for row in csv_rows:
        value = row[INDEX_HERE]

• 2 楼

cricket_007 aybuke 9 年前

只需添加 [1:]

示例如下:

data = pd.read_csv("/Users/xyz/Desktop/xyxData/xyz.csv", sep=',', header=None)**[1:]**

在伊普顿对我有用

• 3 楼

Karel Adams 9 年前

我会用尾要去掉不需要的第一行:

tail -n +2 $INFIL | whatever_script.py

• 4 楼

Lassi 6 年前

这个 documentation for the Python 3 CSV module 提供以下示例:

with open('example.csv', newline='') as csvfile:
    dialect = csv.Sniffer().sniff(csvfile.read(1024))
    csvfile.seek(0)
    reader = csv.reader(csvfile, dialect)
    # ... process CSV file contents here ...

这个 Sniffer 将尝试自动检测CSV文件的许多内容。你需要显式地调用它 has_header() 方法来确定文件是否具有标题行。如果是,则在迭代CSV行时跳过第一行。你可以这样做:

if sniffer.has_header():
    for header_row in reader:
        break
for data_row in reader:
    # do something with the row

• 5 楼

Roy W. 7 年前

因为这和我正在做的事情有关,我将在这里分享。

如果我们不确定是否有一个头,而您也不想导入嗅探器和其他东西呢?

如果您的任务是基本的,例如打印或附加到列表或数组,则可以使用If语句:

# Let's say there's 4 columns
with open('file.csv') as csvfile:
     csvreader = csv.reader(csvfile)
# read first line
     first_line = next(csvreader)
# My headers were just text. You can use any suitable conditional here
     if len(first_line) == 4:
          array.append(first_line)
# Now we'll just iterate over everything else as usual:
     for row in csvreader:
          array.append(row)

• 6 楼

Clint Hart 7 年前

对我来说最简单的方法就是使用射程。

import csv

with open('files/filename.csv') as I:
    reader = csv.reader(I)
    fulllist = list(reader)

# Starting with data skipping header
for item in range(1, len(fulllist)): 
    # Print each row using "item" as the index value
    print (fulllist[item])

• 7 楼

chfw 10 年前

好吧,我的 mini wrapper library 也能胜任这项工作。

>>> import pyexcel as pe
>>> data = pe.load('all16.csv', name_columns_by_row=0)
>>> min(data.column[1])

同时,如果您知道标题列索引1是什么,例如“column 1”,则可以执行以下操作:

>>> min(data.column["Column 1"])

• 8 楼

Finn Årup Nielsen 10 年前

新的“熊猫”软件包可能比“csv”更有意义。下面的代码将读取一个CSV文件,默认情况下,将第一行解释为列标题,并找到跨列的最小值。

import pandas as pd

data = pd.read_csv('all16.csv')
data.min()

• 9 楼

iruvar 13 年前

使用csv.DictReader而不是csv.Reader。如果省略field names参数,则csvfile的第一行中的值将用作字段名。然后您就可以使用第[“1”]行等访问字段值

• 10 楼

shin 7 年前

借来的 python cookbook ,
更简洁的模板代码可能如下所示:

import csv
with open('stocks.csv') as f:
    f_csv = csv.reader(f) 
    headers = next(f_csv) 
    for row in f_csv:
        # Process row ...

• 11 楼

Veedrac Maarten 10 年前

在类似的用例中,我不得不在实际列名所在的行之前跳过恼人的行。这个解决方案很有效。先读取文件,然后将列表传递给 csv.DictReader .

with open('all16.csv') as tmp:
    # Skip first line (if any)
    next(tmp, None)

    # {line_num: row}
    data = dict(enumerate(csv.DictReader(tmp)))

• 12 楼

Jon Clements 13 年前

你通常会使用 next(incsv) 将迭代器向前推进一行,这样就跳过了头。另一个(比如你想跳过30行)是:

from itertools import islice
for row in islice(incsv, 30, None):
    # process

• 13 楼

jfs 13 年前

要跳过第一行,请拨打:

next(inf)

Python中的文件是行上的迭代器。

• 14 楼

martineau 5 年前

您可以使用 csv 模块的 Sniffer 类来推断CSV文件的格式,并检测是否存在头行以及内置的 next() 函数仅在必要时跳过第一行:

import csv

with open('all16.csv', 'r', newline='') as file:
    has_header = csv.Sniffer().has_header(file.read(1024))
    file.seek(0)  # Rewind.
    reader = csv.reader(file)
    if has_header:
        next(reader)  # Skip header row.
    column = 1
    datatype = float
    data = (datatype(row[column]) for row in reader)
    least_value = min(data)

print(least_value)

自从 datatype 和 column 在您的示例中是硬编码的,处理 row 这样地:

    data = (float(row[1]) for row in reader)

注: 上面的代码适用于Python3.x。对于Python2.x,请使用以下行打开文件,而不是显示:

with open('all16.csv', 'rb') as file:

登录后回复