CSpace

浏览/检索结果: 共1条,第1-1条 帮助

已选(0)清除 条数/页:   排序方式:
Consistent multimodal pre-training for visual tokenization 期刊论文
SCIENCE CHINA-INFORMATION SCIENCES, 2025, 卷号: 68, 期号: 10, 页码: 15
作者:  Pan, Ting;  Tang, Lulu;  Wang, Xinlong;  Liu, Xin;  Shan, Shiguang
收藏  |  浏览/下载:1/0  |  提交时间:2025/12/03
foundation model  multimodal  representation learning  visual tokenization