data-preprocessing - 编程之家

我正在解决一个问题，我使用 3 个特征（3 列）使用弹性网络回归预测价格。如果没有标准化或缩放，即

为了使所有特征的所有值都具有相似的比例，我们正确执行特征缩放。我的问题是，如果我们有一个<stro

我有大约 1500 列（特征）和 900 行数据的数据。我正在使用它来删除平均值小于 80% 的值 <pre><code>df1 =

我使用的是二进制分类数据集。我想将名义数据转换为数字。我该怎么办？ <pre><code>age | class ----------

我无法为腌制数据帧列表构建 <code>tf.data</code> 管道（在 python 3.7.7 和 Windows 10 上使用 Tensorflow 2.1.0）。要

我必须使用 R 对包含表情符号的文本片段进行主题建模。使用 <code>replace_emoji()</code> 和 <code>replace_emoticon

我有一份带有 .Doc 扩展名的简历。如何从简历中提取文本数据。 <pre><code>import subprocess import sys def

我有以下数据帧 <a href="https://i.stack.imgur.com/O2o0L.png" rel="nofollow noreferrer"><img src="https://i.stack.imgur.com/

我想对我的数据集中的特征进行标准化步骤，我正在使用 sklearn MinMaxScaler 我希望结果在 (0,1) 的范围内，

我有一个形状数组 (1, 6354944) <pre><code>array([[ 9.15527344e-05, -6.10351562e-05, 6.10351562e-05, ..., 1.01928711e-02,

我是 R 中情感分析的新手，我使用教科书“Text Mining with R: A Tidy Approach”作为预处理文本的主要参考，他

如果一个列有 14 个不同的 [Unique Values]value_counts()，并且它们有一些共同点，在我们的示例中[当我们将 '

我有带有时间戳和多个传感器变量的数据集。<code> dataset dimension = (50000,100).</code> 我可以在 dataprep 上为

我所做的只是将“年份”和“年份”的位置从第一行切换到第二行，反之亦然.. 这是原来的专栏

我已经阅读了一些关于将缩放与交叉验证和超参数调整相集成而不会有数据泄漏风险的内容。我发现的

我有一个包含各种电影类型以及电影是否属于该类型的电影数据集。例如 <pre><code>Index Biography Comedy C

拜托我正在做一个项目，我必须做一些数据预处理我有一个看起来像这样的数据框（这只是一个简化的

我知道在每个时代我们都有一组新的增强。但我的问题是，如果我们总共有 10 个样本图像 <code>batch_size =

我正在从事一个网站消费者行为分析项目，并实时预测用户的恶意活动。正在为用户的每次点击收集点

我需要这里的代码方面的帮助。我正在尝试拟合和转换训练数据，然后转换交叉验证和测试数据。但是