微信公众号搜"智元新知"关注
微信扫一扫可直接关注哦!

H2O无人驾驶AI是否内置合并多个数据集并使用合并的数据集进行训练的支持?

如何解决H2O无人驾驶AI是否内置合并多个数据集并使用合并的数据集进行训练的支持?

假设我们有三个包含公司数据的数据集。

  1. employee.csv :此数据集包含在公司工作的员工的详细信息,例如员工ID,员工名称,工作所在部门的部门ID,他所在国家/地区的国家/地区代码来自和他的年薪。
  2. dept.csv :此数据集包含有关公司部门的信息,例如部门ID,部门名称,部门专业化。
  3. country.csv :此数据集包含一些国家名称及其国家代码和国家的首都。

H2O无人驾驶AI中是否有一项功能,我们可以上传这些数据集(无需使用python进行合并)并在H2O无人驾驶AI平台中进行合并,并使用重叠列进行训练?

解决方法

是的,您可以使用数据配方来处理数据集(包括联接它们)。有关数据配方的更多信息,请参见docs。您可以创建连接数据集的配方。

# Let's join a `employee.csv` (X) to `dept.csv` (Y1) and `country.csv` (Y2)
# Define and read locations of datasets for Y1/Y2
Y_file_name1 = "./tmp/user/location_of_dept.csv.bin"
Y_file_name2 = "./tmp/user/location_of_country.csv.bin"
Y1 = dt.fread(Y_file_name1)
Y2 = dt.fread(Y_file_name2)

# Set key and join Y1
key1 = ["dept_id"]
Y1.key = key1
X = X[:,:,dt.join(Y1)]

# Set key and join Y2
key2 = ["country_code"]
Y2.key = key2
X = X[:,dt.join(Y2)]

return X

请参见this recipe作为将一个数据集连接到另一个数据集的示例。

版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。