Wikidataset preprocessing 썸네일형 리스트형 Wikipedia Dataset Preprocessing 1. Data를 다운받아줍니다. dumps.wikimedia.org/enwiki/latest/ Index of /enwiki/latest/ dumps.wikimedia.org 일반적으로 enwiki-latest-pages-articles1.xml-p1xxx.bz2 데이터를 사용합니다. 클릭하면 자동으로 다운이 받아집니다. 한번씩 많은 데이터를 받으려고 할 때에는 오류가 나기때문에 중간 데이터가 없다고 생각하시지말고 천천히 순차적으로 받아주시면 되겠습니다. 우선은 제일 오른쪽에는 용량이 나와있습니다. 기본 byte로 표시되어 있고 계산기를 통해 1024씩 나눠서 KB, MB, GB로 확인 하실 수 있습니다. 다운을 받으셨다면 폴더를 하나 만들어줍니다. 만든 폴더에서 터미널을 여신후 아래의 코드를 입력해주시.. 더보기 이전 1 다음