农科机构知识库联盟

筛选

全部成果分类

资源类型

中文期刊(566297)
外文期刊(1)
会议论文(35908)
获奖成果(7190)
专利(42595)

期刊名称

knowledge-based systems(1)

关键词

multi-objective reinforcement learning; sample efficiency; reinforcement learning(1)

作者

Liu, Yang AND Zhou, Ying AND He, Ziming AND Yang, Yusen AND Li, Jingchen AND Han, Qingcen(0)

机构

beijing acad agr & forestry sci, informat technol res ctr, beijing 100079, peoples r china(1)
northwestern polytech univ, elect informat coll, xian 710072, shaanxi, peoples r china(1)
northwestern polytech univ, sch comp sci, xian 710072, shaanxi, peoples r china(1)
zhejiang univ, coll opt sci & engn, hangzhou 310058, zhejiang, peoples r china(1)

显示更多

年份

2024(1)

科研产出

条件:

资源类型: 外文期刊

作者:Liu, Yang(精确检索)

作者:Zhou, Ying(精确检索)

作者:He, Ziming(精确检索)

作者:Yang, Yusen(精确检索)

作者:Li, Jingchen(精确检索)

作者:Han, Qingcen(精确检索)

排序方式：

1Dynamic preference inference network: Improving sample efficiency for multi-objective reinforcement learning by preference estimation

作者： Liu, Yang; Zhou, Ying; He, Ziming; Yang, Yusen; Li, Jingchen; Han, Qingcen; SCI

机构： Zhejiang Univ, Coll Opt Sci & Engn, Hangzhou 310058, Zhejiang, Peoples R China; Northwestern Polytech Univ, Sch Comp Sci, Xian 710072, Shaanxi, Peoples R China; Beijing Acad Agr & Forestry Sci, Informat Technol Res Ctr, Beijing 100079, Peoples R China; Northwestern Polytech Univ, Elect Informat Coll, Xian 710072, Shaanxi, Peoples R China;

来源：KNOWLEDGE-BASED SYSTEMS

关键词： Multi-objective reinforcement learning; Sample efficiency; Reinforcement learning

年份：2024