Inteligentne drzewo kategorii na #polish i jak możesz pomóc TY używając tagów w "odpowiedniej" kolejności

title.png

Powiedzmy sobie szczerze, w sieci Steem nie ma jednego moderatora, który stanowi prawo, ale polska społeczność swoimi wysiłkami być może jest pierwsza na świecie, która tak intensywnie szuka rozwiązania dotyczącego m.in. kategoryzowania treści, spamu czy nadużyć.

Idea

@lukmarcus, który jest jednym z kuratorów polskich treści wielokrotnie podnosił kwestię tagowania. Tag #polish po przypływie użytkowników stał się tylko kanałem zbiorczym, który ciężko przeglądać.

Pojawiła się idea stworzenia tagów polskich z przedrostkiem pl-, np. pl-nauka i przyjęła się dość dobrze. Zostaje problem dotarcia do większej ilości piszących.

Potem pojawił się pomysł list kuratorskich:
@marszum/polskie-listy-kuratorskie-plk-kuratorstwo-kolejnego-stopnia - zobacz podtytuł "Podział tagów".

To właśnie ten podział spowodował, że zainteresowałem się hierarchicznością tagów oraz kategoriami podobnymi.

A co najważniejsze interesuje mnie automatyzacja tego, dlatego też powstało..

Narzędzie do odkrywania nowych tagów i ustalania hierarchii - tematycznie

Sposób działania

Dane są zbierane w sposób opisany wcześniej przeze mnie - @rafalski/lista-polskich-tagow-aktualizowana-live-beta , dodałem moduł, który dodatkowo bada kolejność dodawania tagów po sobie, tworząc skojarzenia według kolejności dodania taga.

Dane te są dostępne w formie rozwijalnego po kliknięciu grafu/drzewa.
Dynamiczny graf dostępny pod adresem:

http://steem.swhost.pl/categories

Przykład:

W tagi na grafie można klikać i je rozwijać w celu eksploracji!



Rozwinięty tag pl-tradycja, póki co nie ma tu wielu tagów, ani sensu, gdyż każdy taguje innym systemem.


Jak widzicie w tagach panuje dość spory mętlik, jest to właśnie nasza ukochana decentralizacja, gdzie każdy może tagować jak chce. Nie jest najgorzej jednak - bo wiele osób z nas używa podświadomie systemu, który chciałbym forsować.

Co trzeba zrobić?

Żeby drzewko tagów, którego możecie używać na co dzień pod adresem http://steem.swhost.pl/categories było sensowne i zgodne z logiką (np. muzyka należy do kultury, nie odwrotnie) musimy dojść do konsensusu w tagowaniu.

Algorytm nie wybiera tagów jak człowiek, więc musimy mu pomóc naszą wiedzą na temat tagów, czyli słów - które należą do których dziedzin życia.

Konsensus ten zakłada tag bazowy, tagi "dzieci" dodawane za rodzicem, tagi sieroty dodawane jako 4-ty lub 5-ty, więcej opisałem poniżej.

System tagowania wg. mnie

Biorąc pod uwagę wszelkie moje uwagi z tego posta, schemat tagowania mógłby wyglądać tak:

TAG, NR, kolejno

  • 1: zawsze polish jeśli publikujesz po polsku
  • 2: kategoria pl-kategoria
  • 3: podkategoria należąca do kategorii pl-podkategoria
  • 4: kolejna podkategoria pl-podkategoria lub tag niezależny (pl-artykuly lub tematygodnia lub reakcja lub inny) lub funkcyjny (np. busy) lub obcojęzyczny (np coffee do postu o kawie pisanego w pl i ang)
  • 5: tag niezależny lub funkcyjny lub obcojęzyczny



Co o tym sądzicie?

Jeszcze raz polecam spojrzeć jak to działa live - http://steem.swhost.pl/categories (beta, zobaczcie bajzel w nowym 2018 roku w porównaniu z ostatnimi miesiącami roku 2017)

H2
H3
H4
Upload from PC
Video gallery
3 columns
2 columns
1 column
36 Comments