총 노드 수: 368개
총 관계 수: 992개
| 타입 | 개수 |
|---|---|
| Product | 85 |
| Company | 66 |
| FinancialMetric | 55 |
| Entity | 39 |
| Location | 26 |
| Person | 18 |
| Regulation | 14 |
| Risk | 6 |
| Component | 5 |
| Process | 5 |
| Geopolitics | 4 |
| Financials | 3 |
| Catalyst | 1 |
supply_chain_mapping.pdf(4.5 KB) - 24 엔티티, 18 관계industry_risk_factors.pdf(4.5 KB) - 18 엔티티, 9 관계regulation_guidelines.pdf(5.7 KB) - 28 엔티티, 24 관계tech_roadmap.pdf(6.0 KB) - 34 엔티티, 29 관계
202404 SOX Latest Changes.pdf(983.1 KB)ESIA_WSTS_PR_AuFc2025 미국반도체강점데이터.pdf(412.5 KB)Kpmg global semiconductor outlook.pdf(2460.1 KB)SIA-2024-Factbook.pdf(2998.7 KB)
# Streamlit 앱 실행 (이미 실행 중이면 스킵)
cd /Users/gyuteoi/Desktop/Finance_GraphRAG
streamlit run src/streamlit_app.py브라우저에서 http://localhost:8501 접속
- Visualization 탭: 그래프 시각화
- Query 탭: 질문하기
# 브라우저에서 Neo4j Browser 접속
open http://localhost:7474로그인 정보:
- URI:
bolt://localhost:7687 - Username:
neo4j - Password:
.env 파일 참조
샘플 쿼리:
// 전체 노드 확인
MATCH (n) RETURN n LIMIT 100
// Company 노드만 확인
MATCH (c:Company) RETURN c
// 관계 포함 조회
MATCH p=(a)-[r]->(b) RETURN p LIMIT 50python check_neo4j_data.pypython quick_upload_pdfs.pypython upload_baseline_pdfs.py- http://localhost:8501 접속
- "Database Upload" 탭 선택
- PDF 파일 업로드
✅ Neo4j에 저장된 데이터는 영구적입니다
- 세션 종료 후에도 유지됨
- 서버 재시작 후에도 유지됨
- Docker 컨테이너 재시작 후에도 유지됨 (볼륨 마운트됨)
# Neo4j 데이터 확인
python test_neo4j_direct.py
# PDF 업로드 상태 확인
python check_neo4j_data.py
# 백그라운드 업로드 로그 확인
tail -f upload_progress.log- 그래프 시각화: Streamlit Visualization 탭에서 그래프 탐색
- 질의 테스트: Query 탭에서 "Nvidia supply chain risks" 같은 질문
- 추가 PDF 업로드: 대용량 PDF들도 업로드 (시간이 걸릴 수 있음)
작성일: 2026-01-19
상태: 초기 데이터 업로드 완료, 세션 종료 후에도 데이터 유지 확인됨