Pandas로 txt에서 데이터로드
플로트 및 문자열 데이터가 혼합 된 txt 파일을로드하고 있습니다. 각 요소에 액세스 할 수있는 배열에 저장하고 싶습니다. 이제 난 그냥
import pandas as pd
data = pd.read_csv('output_list.txt', header = None)
print data
다음은 입력 파일의 구조입니다 1 0 2000.0 70.2836942112 1347.28369421 /file_address.txt
..
이제 데이터를 고유 한 열로 가져옵니다. 어떻게 나누어서 다른 요소를 따로 저장할 수 data[i,j]
있습니까? 헤더를 어떻게 정의 할 수 있습니까?
당신이 사용할 수있는:
data = pd.read_csv('output_list.txt', sep=" ", header=None)
data.columns = ["a", "b", "c", "etc."]
sep=" "
코드를 추가 하고 따옴표 사이에 공백을 둡니다. 따라서 팬더는 값 사이의 공백을 감지하고 열을 정렬 할 수 있습니다. 데이터 열은 열 이름을 지정하기위한 것입니다.
위의 답변에 추가하고 싶습니다. 직접 사용할 수 있습니다.
df = pd.read_fwf('output_list.txt')
fwf는 고정 너비 형식의 줄을 나타냅니다.
@Pietrovismara의 솔루션은 정확하지만 추가하고 싶습니다. 열 이름을 추가하는 별도의 줄이 아니라 pd.read_csv에서이 작업을 수행 할 수 있습니다.
df = pd.read_csv('output_list.txt', sep=" ", header=None, names=["a", "b", "c"])
당신은 이것을 사용할 수 있습니다
import pandas as pd
dataset=pd.read_csv("filepath.txt",delimiter="\t")
다음과 같이 할 수 있습니다.
import pandas as pd
df = pd.read_csv('file_location\filename.txt', delimiter = "\t")
(예 : df = pd.read_csv ( 'F : \ Desktop \ ds \ text.txt', 구분 기호 = "\ t")
데이터에 할당 된 인덱스가없고 간격이 무엇인지 확실하지 않은 경우 pandas가 인덱스를 할당하고 여러 공백을 찾도록 할 수 있습니다.
df = pd.read_csv('filename.txt', delimiter= '\s+', index_col=False)
다음과 같이 read_table 명령을 사용하여 텍스트 파일을 가져올 수 있습니다.
import pandas as pd
df=pd.read_table('output_list.txt',header=None)
로드 후 사전 처리를 수행해야합니다.
pandas의 최신 변경 사항에 따라 read_csv를 사용할 수 있으며 read_table은 더 이상 사용되지 않습니다.
import pandas as pd
pd.read_csv("file.txt", sep = "\t")
참고 URL : https://stackoverflow.com/questions/21546739/load-data-from-txt-with-pandas
'programing tip' 카테고리의 다른 글
스레드로부터 안전한 목록 (0) | 2020.08.11 |
---|---|
AngularJS의 여러 특정 모델 속성으로 필터링 (OR 관계) (0) | 2020.08.11 |
미학과 geom_text를 사용할 때 범례에서 'a'제거 (0) | 2020.08.10 |
파이썬의 클래스 상수 (0) | 2020.08.10 |
내부 클래스가 개인 변수에 액세스 할 수 있습니까? (0) | 2020.08.10 |