10.2.3. Options

이 절에서는 Neo4j 임포트(import) 도구를 사용하여 CSV파일에서 데이터 임포트 시 사용할 수있는 옵션에 대해 자세히 설명합니다.
--database=
데이터베이스 이름. 디폴트: graph.db
--additional-config=<설정 파일 경로>
추가 설정을 제공할 설정 파일의 경로. 디폴트:
--mode=
CSV 파일이나 3.0-이전 버전에서 임포트. 디폴트: csv
--from=<소스 디렉터리>
3.0-이전 버전의 데이터베이스의 위치(예를 들면, /data/graph.db). 디폴트:
--report-file=<파일명>
csv-import의 출력 로그를 저장할 파일. 디폴트: import.report
--nodes[:Label1:Label2]=<"file1,file2,…​">
노드 CSV 헤더와 데이터. 여러개의 파일은 임포트 도구의 관점에서는 논리적으로 하나의 큰 파일로 간주됩니다. 첫 번째 줄에는 헤더가 있어야합니다. 이러한 여러 개의 데이터 소스는 한 번의 임포트로 지정할 수 있습니다. 각 데이터 소스에는 고유한 헤더가 있습니다. 파일 그룹은 따옴표로 묶어야합니다. 정규식을 사용하여 파일을 지정할 수도 있습니다. 예를 들어, 입력 파일에 정규식 사용을 참조합니다. 디폴트:
--relationships[:RELATIONSHIP_TYPE]=<"file1,file2,…​">
관계 CSV 헤더와 데이터. 여러개의 파일은 임포트 도구의 관점에서는 논리적으로 하나의 큰 파일로 간주됩니다. 첫 번째 줄에는 헤더가 있어야합니다. 이러한 여러 개의 데이터 소스는 한 번의 임포트로 지정할 수 있습니다. 각 데이터 소스에는 고유한 헤더가 있습니다. 파일 그룹은 따옴표로 묶어야합니다. 정규식을 사용하여 파일을 지정할 수도 있습니다. 예를 들어, 입력 파일에 정규식 사용을 참조합니다. 디폴트:
--id-type=
각 노드는 유일한 id를 가집니다. 이 id값은 관계 생성시, 올바른 노드를 찿는데 사용됩니다. 가능한 값은 다음과 같습니다. STRING:노드 식별을 위한 임의의 문자열, INTEGER:노드 식별을 위한 임의의 정수 값, ACTUAL:(고급) 실제 노드 ID. 디폴트: STRING
--input-encoding=<문자-셋>
입력 데이터의 인코딩 문자-셋입니다. 디폴트: UTF-8 --ignore-extra-columns=
임포트시 지정되지 않은 열(columns)을 무시해야하는 경우 지정합니다. 디폴트: false
--ignore-duplicate-nodes=
임포트시 중복되는 노드를 무시해야하는 경우 지정합니다. 디폴트: false
--ignore-missing-nodes=
임포트시 없는 노드를 참조하는 관계는 무시하도록 지정합니다. 디폴트: false
--multiline-fields=
입력 소스의 필드가 다중 라인, 즉, 개행 문자를 포함하는지 지정합니다. 디폴트: false
--delimiter=<구분-문자>
CSV 데이터에서 값을 구별하는 문자. 앞에 \를 붙이면 유니코드 인코딩이 사용될 수 있습니다. 예를 들면, \44는 ,와 같습니다. 디폴트: ,
--array-delimiter=<배열-구분-문자>
in CSV 데이터 값 내의 배열 요소 사이의 구분 기호 문자. 앞에 \를 붙이면 유니코드 인코딩이 사용될 수 있습니다. 예를 들면, \59는 ;와 같습니다. 디폴트: ;
--quote=<인용-부호>
CSV 데이터의 값에서 인용 부호로 처리할 문자입니다. 따옴표는 두 번 써서 이스케이프 처리합니다 (예 : ""는 문자 "로 해석됩니다). \로 이스케이프 할 수 없습니다. 디폴트: "
--max-memory=<임포트-도구가-사용할-최대-메모리>
neo4j-admin이 다양한 데이터 구조와 성능 향상을 위해 캐싱에 사용할 수 있는 최대 메모리. 값은 10000000과 같은 일반 숫자, 또는 20 기가 바이트는 20G, 사용 가능한 메모리의 백분율, 예를 들면 70%. 디폴트: 90%

입력 파일에 정규식 사용 많은 데이터 소스 파일이 있을 때, 명령 줄을 단순화하기 위해 정규식을 사용하여 파일 이름을 지정할 수 있습니다. 정규식을 포함하는 파일명과 대해 일치하는 파일이 포함됩니다. 매칭은 파일명내의 숫자를 인식하고, 0을 패딩할 필요없이, 적절히 정렬합니다.

파일명이 다음과 같다면:

Category1_Part_001.csv
Category1_Part_002.csv
Category2_Part_001.csv
Category12_Part_001.csv

예를 들어, 임포트 도구에서 정규식 Category.* 을 임포트 도구에 지정하면 위 파일들을 모두 선택하고 위에 표시된 순서대로 유지합니다.

임포트(import)위한 힙 크기
최대 힙 크기를 임포트시 값으로 설정하려고 합니다. 이는 임포트 시작하기 전에 환경 변수 HEAP_SIZE에 정의합니다. 2G는 적절한 값입니다.

로그 파일 출력
대량의 "지저분한" 데이터에서 임포트를 실행하면 임포트 로그 파일이 매우 커질 수 있으며 이로 인해 문제가 발생할 수 있습니다. --report-file 옵션을 사용하여 로그 파일의 위치를 제어합니다. 보고서 파일을 /dev/null로 지정하면 UNIX 계열 시스템의 경우 출력이 없어집니다.

10.2.3.1. 디버깅

임포트시 디버깅을 하려면 콜스택 정보가 유용합니다. 환경 변수 NEO4J_DEBUG=true로 하고 임포트를 재실행하면 콜스택 정보를 얻을 수 있습니다.

results matching ""

    No results matching ""