根据60个特征,70万条数据预测5G用户,一个典型的不平衡二分类问题。According to 60 features, 700000 pieces of data predict 5G users, a typical imbalance problem.
根据60个特征,70万条数据预测5G用户,一个典型的不平衡二分类问题。According to 60 features, 700000 pieces of data predict 5G users, a typical imbalance problem.
主要采用了降采样,特征工程,特征筛选等技术。
多特征不平衡二分类问题.ipynb为notebook版本,其余三个代码为google-colab上的版本。
数据集可以在下方获得。
https://www.turingtopia.com/competitionnew/detail/489796d0d664444b85dc6c6d2b2d67f3/dataset