Logo fi.boatexistence.com

Tarkoittaako k: toimii kategoristen tietojen kanssa?

Sisällysluettelo:

Tarkoittaako k: toimii kategoristen tietojen kanssa?
Tarkoittaako k: toimii kategoristen tietojen kanssa?
Anonim

K-Means algoritmi ei sovellu kategorisille tiedoille, koska kategorialliset muuttujat ovat erillisiä eikä niillä ole luonnollista alkuperää. Joten euklidisen etäisyyden laskeminen esimerkiksi avaruudelle ei ole mielekästä.

Voimmeko käyttää klusterointia kategorisille tiedoille?

Kategoriset tiedot on muutettu numeerisiksi määrittämällä järjestysarvo. On se, että kategorinen tietojoukko voidaan klusteroida numeerisiksi tietojoukoiksi.. On havaittu, että tämän logiikan toteuttaminen, k-keskiarvo, tuottaa saman suorituskyvyn kuin numeerisissa tietojoukoissa.

Voidaanko keskiarvoa käyttää kategorisille muuttujille?

Ei ole mitään keinoa löytää keskiarvoa näistä tiedoista, koska "keskimääräistä" silmien väriä ei ole. Voit löytää mittasuhteet, mutta et keskiarvoa. Toivottavasti tämä auttaa!

Mitä pitäisi käyttää, kun tiedot ovat kategorisia?

Kategoriset tiedot analysoidaan käyttämällä moodia ja mediaanijakaumia, jossa nimellisdata analysoidaan moodilla, kun taas järjestysdata käyttää molempia. Joissakin tapauksissa järjestystietoja voidaan analysoida myös käyttämällä yksimuuttujatilastoja, kaksimuuttujatilastoja, regressiosovelluksia, lineaarisia trendejä ja luokitusmenetelmiä.

Mitä on klusterointi kategorisilla ominaisuuksilla?

Kategorinen dataklusterointi viittaa tapaukseen, jossa tietoobjektit määritellään kategoristen attribuuttien yli … Eli kategorisilla arvoilla ei ole yhtä järjestystä tai luontaista etäisyysfunktiota, ja ei ole olemassa semanttisesti järkevää kartoitusta kategorisista numeerisiksi arvoiksi.

Suositeltava: