一、CSV文件
-
CSV文件是一种逗号分隔值文件格式的纯文本文件(Comma-Seperated Values),现在不仅可以用逗号分隔,也可以用分号、制表符、空格等作为分隔符。
-
CSV文件的每一行是一条记录,每条记录以CRLF(换行符)结尾,最后一行可以没有CRLF;可以有header,即第一行为与下文常规记录数量一致的记录;可以用双引号也可以不用,但如果双引号为记录内容,则需要加双引号转义。
-
CSV文件产生于数据从一个存储系统传递到另一个存储系统的过程中。
-
基本上所有电子表格应用例如EXCEL等,都能够导入CSV文件,数据导入后以分隔符为单位被安排在电子表格的每个单元中。
-
csv文件能够通过可以打开它的应用程序转换为各种不同文件格式,例如:EXCEL可以将CSV打开后存储为XLS、XLSX、PDF、TXT、XML和HTML文件格式;其他在线服务应用也提供将CSV导出为HTML、ODS和RTF文件格式。
参考:https://docs.fileformat.com/spreadsheet/csv/
二、导入CSV文件的方法
- 导入方法的选择取决于数据集的大小。
- 各种方法对比:
方法描述 | 适用数据集 | neo4j配置 | 特点 |
---|---|---|---|
Cypher 命令:LOAD CSV | 中小型数据集(≤10 million records& |