如何解决Pyspark-识别白天还是黑夜
我的数据框如下:
+--------------------+---------------------+-------------+------------+
|tpep_pickup_datetime|tpep_dropoff_datetime|trip_distance|total_amount
+--------------------+---------------------+-------------+------------+
| 2019-01-01 08:53:20| 2019-01-01 09:01:00| 1.5| 2.00|
| 2019-01-01 21:18:59| 2019-01-01 21:59:59| 2.6| 5.00|
| 2019-01-01 08:53:20| 2019-01-01 10:01:00| 1.5| 2.00|
| 2019-01-01 21:18:59| 2019-01-01 22:59:59| 2.6| 5.00|
+--------------------+---------------------+-------------+------------+
我需要创建一个表来计算所有夜间和白天旅行的trip_rate(总金额/ trip_distance),以便最终结果如下所示:
+------------+-----------+
| day_night | trip_rate |
+------------+-----------+
|Day | 1.33 |
|Night | 1.92 |
+------------+-----------+
鉴于以下情况,我在尝试区分夜晚与白天时遇到了麻烦:
day_night will have 'Day' or 'Night':
- From 9am to 8:59:59pm - Day
- From 9pm to 8:59:59am - Night
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。