Pandas로 txt에서 데이터로드

programing tip

itbloger 2020. 8. 11. 08:02

플로트 및 문자열 데이터가 혼합 된 txt 파일을로드하고 있습니다. 각 요소에 액세스 할 수있는 배열에 저장하고 싶습니다. 이제 난 그냥

import pandas as pd

data = pd.read_csv('output_list.txt', header = None)
print data

다음은 입력 파일의 구조입니다 1 0 2000.0 70.2836942112 1347.28369421 /file_address.txt..

이제 데이터를 고유 한 열로 가져옵니다. 어떻게 나누어서 다른 요소를 따로 저장할 수 data[i,j]있습니까? 헤더를 어떻게 정의 할 수 있습니까?

당신이 사용할 수있는:

data = pd.read_csv('output_list.txt', sep=" ", header=None)
data.columns = ["a", "b", "c", "etc."]

sep=" "코드를 추가 하고 따옴표 사이에 공백을 둡니다. 따라서 팬더는 값 사이의 공백을 감지하고 열을 정렬 할 수 있습니다. 데이터 열은 열 이름을 지정하기위한 것입니다.

위의 답변에 추가하고 싶습니다. 직접 사용할 수 있습니다.

df = pd.read_fwf('output_list.txt')

fwf는 고정 너비 형식의 줄을 나타냅니다.

@Pietrovismara의 솔루션은 정확하지만 추가하고 싶습니다. 열 이름을 추가하는 별도의 줄이 아니라 pd.read_csv에서이 작업을 수행 할 수 있습니다.

df = pd.read_csv('output_list.txt', sep=" ", header=None, names=["a", "b", "c"])

당신은 이것을 사용할 수 있습니다

import pandas as pd
dataset=pd.read_csv("filepath.txt",delimiter="\t")

다음과 같이 할 수 있습니다.

import pandas as pd
df = pd.read_csv('file_location\filename.txt', delimiter = "\t")

(예 : df = pd.read_csv ( 'F : \ Desktop \ ds \ text.txt', 구분 기호 = "\ t")

데이터에 할당 된 인덱스가없고 간격이 무엇인지 확실하지 않은 경우 pandas가 인덱스를 할당하고 여러 공백을 찾도록 할 수 있습니다.

df = pd.read_csv('filename.txt', delimiter= '\s+', index_col=False)

다음과 같이 read_table 명령을 사용하여 텍스트 파일을 가져올 수 있습니다.

import pandas as pd
df=pd.read_table('output_list.txt',header=None)

로드 후 사전 처리를 수행해야합니다.

pandas의 최신 변경 사항에 따라 read_csv를 사용할 수 있으며 read_table은 더 이상 사용되지 않습니다.

import pandas as pd
pd.read_csv("file.txt", sep = "\t")

스레드로부터 안전한 목록 (0)	2020.08.11
AngularJS의 여러 특정 모델 속성으로 필터링 (OR 관계) (0)	2020.08.11
미학과 geom_text를 사용할 때 범례에서 'a'제거 (0)	2020.08.10
파이썬의 클래스 상수 (0)	2020.08.10
내부 클래스가 개인 변수에 액세스 할 수 있습니까? (0)	2020.08.10

itbloger