programing tip

Pandas로 txt에서 데이터로드

itbloger 2020. 8. 11. 08:02
반응형

Pandas로 txt에서 데이터로드


플로트 및 문자열 데이터가 혼합 된 txt 파일을로드하고 있습니다. 각 요소에 액세스 할 수있는 배열에 저장하고 싶습니다. 이제 난 그냥

import pandas as pd

data = pd.read_csv('output_list.txt', header = None)
print data

다음은 입력 파일의 구조입니다 1 0 2000.0 70.2836942112 1347.28369421 /file_address.txt..

이제 데이터를 고유 한 열로 가져옵니다. 어떻게 나누어서 다른 요소를 따로 저장할 수 data[i,j]있습니까? 헤더를 어떻게 정의 할 수 있습니까?


당신이 사용할 수있는:

data = pd.read_csv('output_list.txt', sep=" ", header=None)
data.columns = ["a", "b", "c", "etc."]

sep=" "코드를 추가 하고 따옴표 사이에 공백을 둡니다. 따라서 팬더는 값 사이의 공백을 감지하고 열을 정렬 할 수 있습니다. 데이터 열은 열 이름을 지정하기위한 것입니다.


위의 답변에 추가하고 싶습니다. 직접 사용할 수 있습니다.

df = pd.read_fwf('output_list.txt')

fwf는 고정 너비 형식의 줄을 나타냅니다.


@Pietrovismara의 솔루션은 정확하지만 추가하고 싶습니다. 열 이름을 추가하는 별도의 줄이 아니라 pd.read_csv에서이 작업을 수행 할 수 있습니다.

df = pd.read_csv('output_list.txt', sep=" ", header=None, names=["a", "b", "c"])

당신은 이것을 사용할 수 있습니다

import pandas as pd
dataset=pd.read_csv("filepath.txt",delimiter="\t")

다음과 같이 할 수 있습니다.

import pandas as pd
df = pd.read_csv('file_location\filename.txt', delimiter = "\t")

(예 : df = pd.read_csv ( 'F : \ Desktop \ ds \ text.txt', 구분 기호 = "\ t")


데이터에 할당 된 인덱스가없고 간격이 무엇인지 확실하지 않은 경우 pandas가 인덱스를 할당하고 여러 공백을 찾도록 할 수 있습니다.

df = pd.read_csv('filename.txt', delimiter= '\s+', index_col=False)

다음과 같이 read_table 명령을 사용하여 텍스트 파일을 가져올 수 있습니다.

import pandas as pd
df=pd.read_table('output_list.txt',header=None)

로드 후 사전 처리를 수행해야합니다.


pandas의 최신 변경 사항에 따라 read_csv를 사용할 수 있으며 read_table은 더 이상 사용되지 않습니다.

import pandas as pd
pd.read_csv("file.txt", sep = "\t")

참고 URL : https://stackoverflow.com/questions/21546739/load-data-from-txt-with-pandas

반응형