tag:speakerdeck.com,2005:/spatial_ai_networktag:speakerdeck.com,2005:Talk/14877862026-01-05T11:39:31-05:002026-01-06T03:49:19-05:00Preconditioned Single-step Transforms �for Non-rigid ICP (Eurographics 2025)Non-rigid(非剛体)ICPは対応探索と形状更新を反復する手法であり、形状更新では一般に平滑化正則化を含む線形最小二乗問題を解いてターゲット形状へ近づける。
しかし初期反復では対応が不正確であるため、各反復で線形最小二乗を高精度に解くことは計算的に非効率になる。
本研究は、各反復で厳密解を求める代わりに、共役勾配法(CG)を1ステップのみ実行して変形を更新するsingle-step transform枠組みを提案する。Spatial AI Network (@spatial_ai_network)tag:speakerdeck.com,2005:Talk/14877762026-01-05T11:06:02-05:002026-01-06T03:44:09-05:00Understanding multi-view transformers (and VGGT)Understanding multi-view transformers
https://arxiv.org/abs/2312.14132
カメラ位置姿勢なしの画像ペアから3D点群を求めるDUSt3Rの推論時のTransformerの挙動を分析。
おまけとしてVGGTでも実験。
https://github.com/soskek/understand_vggtSpatial AI Network (@spatial_ai_network)tag:speakerdeck.com,2005:Talk/14877412026-01-05T09:23:48-05:002026-01-06T03:29:24-05:00Uncalibrated Structure from Motion on a Sphere (ICCV 2025)Uncalibrated Structure from Motion on a Sphere (ICCV2025)
https://jonathanventura.github.io/spherical-sfm/
回転運動(Spherical Motion)撮影された未校正カメラ画像に対するStructure from Motionにおいて球面拘束を用いた初期化および復元パイプラインを提案。Spatial AI Network (@spatial_ai_network)tag:speakerdeck.com,2005:Talk/14781872025-12-11T09:10:05-05:002025-12-11T09:12:39-05:00ChatGPTで論⽂は読めるのか概要: ChatGPTを使って論文が読めるのかどうか,簡単な実験で検証しました
リンク
- エンタメとAIのための3Dパラレルワールド構築(GPU UNITE 2025 特別講演) https://speakerdeck.com/pfn/20251015-gpu-unite-2025-pfn-3d-parallel-world
- 深層学習と3Dキャプチャ・3Dモデル生成(土木学会応用力学委員会 応用数理・AIセミナー) https://speakerdeck.com/pfn/20250109_jsce_pfn
- 三次元再構成(東京大学大学院 情報理工学系研究科『知能情報論』) https://speakerdeck.com/pfn/20240613-utokyo-intelligent-informatics
- 落合陽一先生の論文まとめフォーマット https://lafrenze.hatenablog.com/entry/2015/08/04/120205
- Lyra: Generative 3D Scene Reconstruction via Video Diffusion Model Self-Distillation https://speakerdeck.com/spatial_ai_network/lyra-generative-3d-scene-reconstructionvia-video-diffusion-model-self-distillation
- HyRF: Hybrid Radiance Fields for Memory-efficient and High-quality Novel View Synthesis https://speakerdeck.com/spatial_ai_network/hyrf-hybrid-radiance-fields-for-novel-view-synthesis
- Kato+ 2018 https://nmr.hiroharu-kato.com/Spatial AI Network (@spatial_ai_network)tag:speakerdeck.com,2005:Talk/14781792025-12-11T08:36:30-05:002025-12-11T08:42:11-05:00Human Mesh Modeling for Anny Body + α- 様々な人体形状に対応可能なスキャンフリーの人体メッシュモデルAnnyを提案
- スキャンに基づかない手法でありながらSMPLと同等以上の表現力を持ち、直感的なパラメータ操作で人体のモデリングが可能
- 微分可能なモデルとして実装されており、Apache 2.0ライセンスで公開されている
- +αとして実際に3DGSと組み合わせた簡易的な実験を実施Spatial AI Network (@spatial_ai_network)tag:speakerdeck.com,2005:Talk/14702112025-11-24T09:55:16-05:002025-12-11T08:43:04-05:00CL-Splats: Continual Learning of Gaussian Splatting with Local Optimization- シーンが変化した際にGaussian Splattingを効率的に更新するCL-Splatsを提案。変化領域のみを局所的に最適化することで既存手法の75倍高速な処理を実現。
- DINOv2による2D変化検出と多数決投票による3Dマッピングを組み合わせ、変化部分のGaussianのみを最適化し高品質な再構成を達成。
- 明示的な3D表現により過去のシーン状態の効率的な復元を可能にし、リアルタイムレンダリングも可能。Spatial AI Network (@spatial_ai_network)tag:speakerdeck.com,2005:Talk/14702092025-11-24T09:52:24-05:002025-12-11T08:43:32-05:00Exploring ways to enhance robustnessof 3D reconstruction using COLMAP- VGGTなどのニューラルネットワークベースの3D Reconstructionはロバストで強力だが、VRAM使用量が大きく動作環境に制約があるため、COLMAPのロバスト化を図った
- 今回、HLoCを使ってロバストに3D Reconstructionできるfeature extractor、feature matcherの組み合わせを実験的に調べた
- 店舗から協力のもと店舗で撮影したRGBカメラデータを使って高精度に3D Reconstructionできることを確認Spatial AI Network (@spatial_ai_network)tag:speakerdeck.com,2005:Talk/14609812025-11-04T21:13:51-05:002025-11-04T21:17:50-05:00GaussianShader: 3D Gaussian Splatting with Shading Functions for Reflective Surfaces3D Gaussian Splatting(3DGS)において鏡面反射を表現するため、各Gaussianに法線や粗さなどのShading Attributesを付与し、環境光マップと組み合わせて学習を行った。この手法により、鏡面反射の強い物体を対象とした場合において、従来の3DGSよりも高精度な外観再現が可能となった。Spatial AI Network (@spatial_ai_network)tag:speakerdeck.com,2005:Talk/14609802025-11-04T21:13:41-05:002025-11-04T21:16:35-05:00HyRF: Hybrid Radiance Fields for Memory-efficient and High-quality Novel View Synthesisガウシアンプラッティングとニューラルフィールドを組み合わせたハイブリッドアプローチを提案
ジオメトリと外観のプロパティを分離したニューラルフィールドアーキテクチャと背景レンダリングを通じて高周波の詳細を保持しつつ、モデルサイズを大きく圧縮Spatial AI Network (@spatial_ai_network)tag:speakerdeck.com,2005:Talk/14609792025-11-04T21:13:20-05:002025-11-04T21:16:20-05:00Lyra: Generative 3D Scene Reconstruction via Video Diffusion Model Self-Distillation画像/動画からのfeed-forwardな3D/4Dシーンの生成手法
動画拡散モデルの3D知識を3DGS生成器に自己蒸留し、実世界の多視点データ不要で学習Spatial AI Network (@spatial_ai_network)tag:speakerdeck.com,2005:Talk/14609732025-11-04T20:32:33-05:002025-11-04T20:35:32-05:003D Prior is All You Need: Cross-Task Few-shot 2D Gaze Estimation学習済みの3次元視線方向推定モデルを少数枚の画像でファインチューニングすることで、スクリーンとカメラ間の外部キャリブレーションを行わずに高精度な2次元注視点推定を実現するSpatial AI Network (@spatial_ai_network)tag:speakerdeck.com,2005:Talk/14232272025-08-12T22:39:55-04:002025-08-12T22:40:58-04:00High-Fidelity Lightweight Mesh Reconstruction from Point Clouds [CVPR 2025]- 点群からのメッシュ化においてSDF表面の曲率に基づいたアダプティブなメッシュ化を提案
- 既存研究よりも高い忠実度を維持しつつ頂点数が5~15%の軽量メッシュを実現Spatial AI Network (@spatial_ai_network)tag:speakerdeck.com,2005:Talk/14232262025-08-12T22:38:49-04:002025-08-12T22:39:38-04:00GEN3C: 3D-Informed World-Consistent Video Generation with Precise Camera Control- 入力フレームから取得した色付きポイントクラウド(3Dキャッシュ)に基づき、ユーザーが指定したカメラ軌道に従った、一貫性のある動画生成を実現
- 入力画像/動画と矛盾がなく、かつPhoto-realisticな動画生成が可能となり、様々なNVSタスクでSOTAを達成Spatial AI Network (@spatial_ai_network)tag:speakerdeck.com,2005:Talk/14162522025-07-29T21:36:13-04:002025-07-29T21:38:04-04:00Sparc3D: Sparse Representation and Construction for High-Resolution 3D Shapes ModelingSpatial AI Network (@spatial_ai_network)tag:speakerdeck.com,2005:Talk/13994532025-07-09T22:22:09-04:002025-07-10T01:28:05-04:00光学・物理原理に基づく深層画像生成近年の画像生成AIは深層学習の進展により、リアルな画像を生成可能になっています。しかし、従来のモデルはブラックボックス的で、光学的・物理的整合性が保証されないこともあります。そこで注目されているのが、光学・物理モデルを取り入れた手法であり、本発表ではその研究事例を紹介・解説します。Spatial AI Network (@spatial_ai_network)tag:speakerdeck.com,2005:Talk/13994512025-07-09T22:19:55-04:002025-07-09T22:20:52-04:00Vision-based 3D reconstruction for navigation and characterization of unknown, space-borne targetsSpatial AI Network (@spatial_ai_network)tag:speakerdeck.com,2005:Talk/13994482025-07-09T22:17:38-04:002025-07-09T22:18:02-04:00Difix3D+: Improving 3D Reconstructions with Single-Step Diffusion Models (CVPR2025 Best Paper Award Candidate)- NeRFや3DGSにおける極端な視点からのレンダリングのアーティファクトを、単一ステップ拡散モデル「Difix」で除去するDifix3D+を提案
- Difixは、3D再構成時にアーティファクト付きのビューをクリーンアップして品質を向上させ、推論時にはリアルタイムでアーティファクトを除去
- NeRFと3DGSの両方に対応し、既存手法よりFIDスコアを平均2倍改善しつつ3Dの一貫性を維持Spatial AI Network (@spatial_ai_network)tag:speakerdeck.com,2005:Talk/13994302025-07-09T20:49:49-04:002025-07-09T20:52:11-04:003D Gaussian Splattingにおける派生プリミティブの設計3D Gaussian Splatting(3DGS)は、微分可能ラスタライゼーションにより高速かつ高品質な新規視点合成を実現した。本発表では、3DGSがプリミティブとしてガウス分布を採用するに至った経緯とガウス分布に起因する表面表現や非連続形状の再現といった課題を指摘し、それらを克服する2DGS、Student Splattingなどの派生プリミティブを紹介・比較する。Spatial AI Network (@spatial_ai_network)Spatial AI Network (@spatial_ai_network) on Speaker Deck2026-01-05T11:39:31-05:00