微信公众号搜"智元新知"关注
微信扫一扫可直接关注哦!

Pyspark-识别白天还是黑夜

如何解决Pyspark-识别白天还是黑夜

我的数据框如下:

+--------------------+---------------------+-------------+------------+
|tpep_pickup_datetime|tpep_dropoff_datetime|trip_distance|total_amount
+--------------------+---------------------+-------------+------------+
| 2019-01-01 08:53:20|  2019-01-01 09:01:00|          1.5|        2.00|
| 2019-01-01 21:18:59|  2019-01-01 21:59:59|          2.6|        5.00|
| 2019-01-01 08:53:20|  2019-01-01 10:01:00|          1.5|        2.00|
| 2019-01-01 21:18:59|  2019-01-01 22:59:59|          2.6|        5.00|
+--------------------+---------------------+-------------+------------+

我需要创建一个表来计算所有夜间和白天旅行的trip_rate(总金额/ trip_distance),以便最终结果如下所示:


+------------+-----------+
| day_night  | trip_rate |
+------------+-----------+
|Day         | 1.33      |
|Night       | 1.92      |
+------------+-----------+

鉴于以下情况,我在尝试区分夜晚与白天时遇到了麻烦:

    day_night will have 'Day' or 'Night':
        - From 9am to 8:59:59pm - Day
        - From 9pm to 8:59:59am - Night

版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。