Pandas: ENH: دعم أحرف التعليق المتعددة مع القراء

تم إنشاؤها على ٤ نوفمبر ٢٠١٤ · 3تعليقات · مصدر: pandas-dev/pandas

سأكون سعيدًا جدًا إذا دعمت Pandas أحرف تعليق متعددة عند قراءة البيانات من الملفات. وفق:

import pandas as pd
df = pd.read_table("data.dat", comment=("#","@"), delim_whitespace=True)

لا أعرف ما إذا كان هذا يتطلب جهد تنفيذ بسيط أو كبير؟

الأفضل،
إريك

Enhancement IO CSV

مصدر

ebran

التعليق الأكثر فائدة

متعلق ب:

سيكون رائعًا إذا كان من الممكن أن يكون حرف التعليق في الواقع حرفين ، على سبيل المثال "##". على سبيل المثال ، في ملفات VCF ، يتم تحديد بعض بيانات التعريف في بداية الملف بـ "##" قبل بدء الجدول الفعلي:

http://www.internationalgenome.org/wiki/Analysis/vcf4.0/

غالبًا ما يريد المرء فقط تجاهل هذه ، ولكن:

df = pd.read_csv("data.vcf", comment="##")

لا يعمل. لاحظ أنه بالنسبة إلى VCF ، لن يعمل استخدام comment="#" فقط لأن سطر العنوان يبدأ فعليًا بـ "#" واحد.

dansondergaard في ٢٢ نوفمبر ٢٠١٦

👍11

ال 3 كومينتر

سيكون هذا القليل من الجهد. القارئ أساسًا بايت بايت (مع بعض إمكانية الرجوع للخلف). لذلك سيتعين عليه التحقق مرة أخرى من المخزن المؤقت لأحرف التعليقات (يقوم بالتحقق فقط من الحرف الفردي الآن ، ولكن فقط إذا لم يكن NULL) ، بطريقة فعالة. يمكن القيام به.

jreback في ٤ نوفمبر ٢٠١٤

متعلق ب:

http://www.internationalgenome.org/wiki/Analysis/vcf4.0/

غالبًا ما يريد المرء فقط تجاهل هذه ، ولكن:

df = pd.read_csv("data.vcf", comment="##")

لا يعمل. لاحظ أنه بالنسبة إلى VCF ، لن يعمل استخدام comment="#" فقط لأن سطر العنوان يبدأ فعليًا بـ "#" واحد.

dansondergaard في ٢٢ نوفمبر ٢٠١٦

👍11

سيكون هذا صعبًا. أنا أغلق هذا الآن

wesm في ٦ يوليو ٢٠١٨

هل كانت هذه الصفحة مفيدة؟

0 / 5 - 0 التقييمات

القضايا ذات الصلة

فشل read_csv (filename_with_asian_locale) في python 3.6 للنوافذ

mfmain · 3تعليقات

AttributeError: لا يمكن استخدام الباندا من ملف نصي

songololo · 3تعليقات

BUG: لا يعمل fillna مع inplace مع اختيار أعمدة متعددة حسب loc

hiiwave · 3تعليقات

يزيل read_json () الشرطة السفلية ويحول السلسلة إلى عدد صحيح عند وجود الأرقام والشرطة السفلية فقط

abatkins · 3تعليقات

df. المكررة و drop_duplicates ترفع TypeError مع قيم المجموعة والقائمة.

Abrosimov-a-a · 3تعليقات