Guanyi Yu (余冠一)

Guanyi Yu (余冠一)

R&D-Perception@QCraft

MEgATrack: Monochrome Egocentric Articulated Hand-Tracking for Virtual Reality

September 9, 2022 less than 1 minute read

Meta Blog & PDF

知乎的一篇文章把本文的前半部分介绍比较透彻了, 总结来说几点:

camera configuration: 四个640x480鱼眼灰度相机.
pipeline: DetNet + KeyNet
DetNet: 出center + radius + cls
- 推理时有两个tricks: 连续帧外插 + 每次只推一个相机(round-robin)
KeyNet: 输入手部ROI与前一帧的keypoint信息, 输出2D position heatmap + 1D rel-distance heatmap
- 这里适配鱼眼相机使用distance而不是depth, rel-distance和hand scale相关$d^{rel}_{i} = \frac{d_i - \bar{d}}{\phi}$
pose estimation: 实际的关键点优化$E_{2d}$, $E_{dist}$和$E_{temporal}$三项的加权和.
hand scale: 利用stereo信息优化共享的scale参数$\min_{\theta_t, \phi} \sum_{t = 1}^{n}E_{2D}(\theta_t, \phi)$

但是更加重要的后半部分似乎鸽了, 这里自行补充一下.

数据采集用6个鱼眼+1个深度相机, 过程中保证手部在深度相机中是可见的, 其他相机可以遮挡.
标注第一帧, 再通过keypoint + tracking得到序列, 结合时序做后处理 + 人工筛选.
DetNet所需bbox标注需要对齐camera configuration, 仍然用结合tracking的方式, 人工标每个连续段的第一帧.

Comments

You May Also Enjoy

Google Kick Start 2022 Round H Solution

November 13, 2022 1 minute read

Google Kick Start Round H 2022 Running in Circles 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 #include <bits/stdc++.h> using na...

Google Kick Start 2022 Round G Solution

November 13, 2022 1 minute read

Google Kick Start Round G 2022 Walktober 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 #include <bits/stdc++.h> using namespace std;...

Google Kick Start 2022 Round F Solution

September 30, 2022 1 minute read

Google Kick Start Round F 2022 Sort the Fabrics 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 #include...

从C语言到二进制程序[第五期一生一芯计划 - P4]

September 25, 2022 less than 1 minute read

Slides 笔记预处理: 主要是文本替换, #include, #define等; 其他还有去除注释, 条件编译(#ifdef等), 字符串拼接等. 编译词法分析: 识别token与位置, 本质文本匹配. 语法分析: 根据C语法把tok...