×
验证码:
换一张
忘记密码?
记住我
×
登录
中文版
|
English
中国科学院计算技术研究所机构知识库
Institute of Computing Technology, Chinese Academy IR
登录
注册
ALL
ORCID
题名
作者
学科领域
关键词
文献类型
出处
收录类别
出版者
发表日期
存缴日期
资助项目
学科门类
学习讨论厅
图片搜索
粘贴图片网址
首页
研究单元&专题
作者
文献类型
学科分类
知识图谱
新闻&公告
在结果中检索
研究单元&专题
中国科学院计算技术研... [3]
作者
Guo, Xiaoq... [3]
Jiang, Shu... [3]
Li, Xiangy... [3]
Chai, Zife... [2]
Wang, Ziha... [2]
Yang, Jiah... [2]
更多...
文献类型
期刊论文 [3]
发表日期
2023 [3]
语种
英语 [3]
出处
IEEE TRANS... [2]
IEEE TRANS... [1]
资助项目
Beijing Na... [1]
National N... [1]
National N... [1]
National N... [1]
National N... [1]
National N... [1]
更多...
收录类别
SCI [3]
资助机构
×
知识图谱
CSpace
开始提交
已提交作品
待认领作品
已认领作品
未提交全文
收藏管理
QQ客服
官方微博
反馈留言
浏览/检索结果:
共3条,第1-3条
帮助
已选(
0
)
清除
条数/页:
5
10
15
20
25
30
35
40
45
50
55
60
65
70
75
80
85
90
95
100
排序方式:
请选择
作者升序
作者降序
WOS被引频次升序
WOS被引频次降序
提交时间升序
提交时间降序
期刊影响因子升序
期刊影响因子降序
题名升序
题名降序
发表日期升序
发表日期降序
MemBridge: Video-Language Pre-Training With Memory-Augmented Inter-Modality Bridge
期刊论文
IEEE TRANSACTIONS ON IMAGE PROCESSING, 2023, 卷号: 32, 页码: 4073-4087
作者:
Yang, Jiahao
;
Li, Xiangyang
;
Zheng, Mao
;
Wang, Zihan
;
Zhu, Yongqing
;
Guo, Xiaoqian
;
Yuan, Yuchen
;
Chai, Zifeng
;
Jiang, Shuqiang
收藏
  |  
浏览/下载:22/0
  |  
提交时间:2023/12/04
Video-language pre-training
inter-modality bridge
memory module
TransWeaver: Weave Image Pairs for Class Agnostic Common Object Detection
期刊论文
IEEE TRANSACTIONS ON IMAGE PROCESSING, 2023, 卷号: 32, 页码: 2947-2959
作者:
Guo, Xiaoqian
;
Li, Xiangyang
;
Wang, Yaowei
;
Jiang, Shuqiang
收藏
  |  
浏览/下载:15/0
  |  
提交时间:2023/12/04
Proposals
Object detection
Task analysis
Feature extraction
Visualization
Training
Measurement
Common object detection
transweaver
transformer
Focus and Align: Learning Tube Tokens for Video-Language Pre-Training
期刊论文
IEEE TRANSACTIONS ON MULTIMEDIA, 2023, 卷号: 25, 页码: 8036-8050
作者:
Zhu, Yongqing
;
Li, Xiangyang
;
Zheng, Mao
;
Yang, Jiahao
;
Wang, Zihan
;
Guo, Xiaoqian
;
Chai, Zifeng
;
Yuan, Yuchen
;
Jiang, Shuqiang
收藏
  |  
浏览/下载:11/0
  |  
提交时间:2024/05/20
Electron tubes
Semantics
Visualization
Feature extraction
Task analysis
Transformers
Detectors
Local alignment mechanism
semantic centers
tube tokens
video-language pre-training