从SQL Server导出CSV数据导入到Neo4j图形数据库
问题描述:
我需要从SQL Server批量导入一些高度连接的数据到Neo4j进行分析。从SQL Server导出CSV数据导入到Neo4j图形数据库
有2个链接Neo4j的开发者指南中discusss这样的:
我第一次尝试从SQL Server导入和生成CSV文件导入数据导出向导无法将我的表中的列加载到节点属性中。
有没有人知道配置SSIS包以产生符合Neo4j要求的CSV导出的指南?
答
我没有指导,以指向你,但我可以为你指明正确的方向来解决这个问题你自己:
- 不要使用导入导出向导 - 这是非常有限在您配置平面文件目标的能力中,它不会允许您修复管道中的数据。
-
听起来就像他们想要一个标题行一样。这意味着您需要确保数据的第一行是。如果您的数据来自SQL,则可以使用UNION完成。即
SELECT 'Column1' as Column1 , 'Column2' as Column2 UNION SELECT <actual data from my table>
将平面文件连接管理器通过
-
您可以使用派生列或脚本任务,把引号特殊的“第一个数据行中列名”检查有标题行在文本字符或报价:
- "Special character in non-quoted text ← make sure unusual text is always quoted" - "stray quotes – standalone double or single quote in the middle of non-quoted text, or non-escaped quotes in quoted text ← escape or remove stray quotes"
每链接中的建议,您可以使用CSVkit或爸爸解析来检查你最后的问题在尝试将其上传到neo4j之前,您可以使用CSV文件。通常,这些数据质量问题是特定于您的域的,一旦少数问题得到解决,就不需要进一步照顾和喂养。