在评估准确性方面。您应该记住,k均值 ,因此分析准确性不是一个好主意。您可以执行此操作,但这不是k- means的目的。它应该找到一组最大的集群间距离的数据,而不使用您的标签进行训练。因此,通常使用RandIndex和其他聚类指标来测试k均值。为了使准确性最大化,您应该适合实际的分类器,例如kNN,逻辑回归,SVM等。
就代码本身而言,k_means.predict(X_test)
标签,它不更新内部labels_
字段,您应该这样做
print(k_means.predict(X_test))
此外,在python中,您不必(也不应该)用于[:]
打印数组,只需执行
print(k_means.labels_)
print(y_test)