0 引言
1 网约车需求分布特征
2 IDWPSO-K-means算法
2.1 K-means算法
2.2 IDWPSO算法
2.3 IDWPSO-K-means算法
3 实例分析
3.1 基于时段特征的网约车需求聚类分析
表1 基于时段特征的IDWPSO-K-means聚类检验系数 |
| 聚类数目 | DBI | STDI |
|---|---|---|
| 2 | 0.416 7 | 3.129 1 |
| 3 | 0.802 8 | 2.799 9 |
| 4 | 0.848 0 | 2.324 6 |
| 5 | 0.944 2 | 2.706 5 |
| 6 | 0.807 9 | 2.688 8 |
| 7 | 0.552 1 | 1.697 1 |
| 8 | 0.574 4 | 2.253 5 |
| 9 | 0.515 5 | 1.081 0 |
| 10 | 0.471 1 | 0.032 6 |
表2 基于时段特征的IDWPSO-K-means聚类结果 |
| 聚类标签 | 聚类结果 |
|---|---|
| 聚类1 | 0:00—7:20; 23:20—23:50 |
| 聚类2 | 7:30—23:10 |
3.2 基于日特征的网约车需求聚类分析
表3 基于日特征的IDWPSO-K-means聚类检验系数 |
| 聚类数目 | DBI | STDI |
|---|---|---|
| 2 | 1.014 9 | 0.486 6 |
| 3 | 1.658 4 | 0.400 8 |
| 4 | 1.011 1 | 0.592 2 |
| 5 | 1.374 3 | 0.455 2 |
| 6 | 0.976 4 | 0.234 4 |
| 7 | 1.539 6 | 0.402 4 |
| 8 | 1.012 2 | 0.405 3 |
| 9 | 0.755 2 | 0.475 4 |
| 10 | 1.468 1 | 0.090 7 |
表4 基于日特征的IDWPSO-K-means聚类结果 |
| 聚类标签 | 聚类结果 |
|---|---|
| 聚类1 | 5月22日(周一)—5月24日(周三)、5月26日(周五)、5月29日(周一)—6月2日(周五)、6月4日(周日)—6月8日(周四)、6月12日(周一)—6月15日(周四)、6月19日(周一)—6月22日(周四)、6月26日(周一)—6月28日(周三)、7月3日(周一) |
| 聚类2 | 5月25日(周四)、6月29日(周四)—6月30日(周五)、7月4日(周二)—7月6日(周四)、7月10日(周一)—7月13日(周四)、7月17日(周一)—7月20日(周四) |
| 聚类3 | 6月10日(周六)、6月16日(周五)—6月17日(周六)、6月23日(周五)—6月24日(周六)、7月1日(周六)、7月7日(周五)—7月9日(周日)、7月14日(周五)—7月15日(周六)、7月21日(周五) |
| 聚类4 | 5月27日(周日)—5月28日(周一)、6月3日(周六)、6月9日(周五)、6月11日(周日)、6月18日(周日)、6月25日(周日)、7月2日(周日) |
3.3 对比分析
3.3.1 基于时段特征聚类的对比分析
表5 基于时段特征聚类的3种算法的误差平方和 |
| 聚类 数目 | K-means 算法 | PSO-K-means 算法 | IDWPSO-K- means算法 |
|---|---|---|---|
| 2 | 82 791 331.86 | 20 049 685.02 | 20 049 685.02 |
| 3 | 50 221 043.46 | 12 884 748.65 | 17 267 682.50 |
| 4 | 36 616 390.12 | 11 120 487.11 | 8 667 211.81 |
| 5 | 29 556 272.47 | 28 841 675.83 | 28 197 094.79 |
| 6 | 24 865 769.14 | 8 409 391.54 | 7 897 607.55 |
| 7 | 21 690 835.05 | 18 905 923.90 | 17 777 274.44 |
| 8 | 18 805 283.55 | 12 122 958.93 | 12 066 830.55 |
| 9 | 17 001 356.49 | 16 983 535.29 | 15 650 743.72 |
| 10 | 15 687 904.06 | 15 234 780.25 | 14 624 142.05 |
表6 基于时段特征聚类的3种算法的迭代次数 |
| 聚类 数目 | K-means 算法 | PSO-K-means 算法 | IDWPSO-K-means算法 |
|---|---|---|---|
| 2 | 3 | 3 | 2 |
| 3 | 7 | 6 | 3 |
| 4 | 5 | 1 | 1 |
| 5 | 8 | 3 | 2 |
| 6 | 10 | 2 | 3 |
| 7 | 6 | 5 | 4 |
| 8 | 5 | 8 | 6 |
| 9 | 3 | 2 | 1 |
| 10 | 3 | 3 | 1 |
3.3.2 基于日特征聚类的对比分析
表7 基于日特征聚类的3种算法的误差平方和 |
| 聚类 数目 | K-means 算法 | PSO-K-means 算法 | IDWPSO-K-means 算法 |
|---|---|---|---|
| 2 | 26 462 167.65 | 23 762 167.66 | 21 276 623.22 |
| 3 | 99 982 435.74 | 21 144 213.27 | 20 860 417.37 |
| 4 | 28 984 005.69 | 19 752 091.58 | 18 467 219.12 |
| 5 | 56 081 524.23 | 17 119 710.81 | 16 455 869.70 |
| 6 | 57 678 352.03 | 18 522 641.77 | 16 297 209.18 |
| 7 | 28 949 281.39 | 15 115 674.15 | 15 088 991.85 |
| 8 | 42 023 002.78 | 13 450 560.85 | 16 263 418.25 |
| 9 | 95 924 778.97 | 13 393 906.29 | 18 008 477.25 |
| 10 | 29 660 392.18 | 12 566 707.12 | 15 915 483.74 |
表8 基于日特征聚类的3种算法的迭代次数 |
| 聚类 数目 | K-means 算法 | PSO-K-means 算法 | IDWPSO-K-means 算法 |
|---|---|---|---|
| 2 | 1 | 1 | 1 |
| 3 | 2 | 6 | 2 |
| 4 | 2 | 2 | 2 |
| 5 | 3 | 2 | 2 |
| 6 | 3 | 6 | 1 |
| 7 | 7 | 5 | 3 |
| 8 | 4 | 4 | 4 |
| 9 | 3 | 2 | 3 |
| 10 | 9 | 7 | 3 |