Enlace automático de términos importantes / difíciles en un documento con direcciones URL externas o URL interwiki / intrawiki.
Para ello, primero debe crear un clasificador que clasifique cada término en el documento como difícil o no. Puedes vincular los términos clasificados como difíciles con alguna URL. Luego puede evaluar su clasificador comparando los términos vinculados por su clasificador con los términos actualmente vinculados en Wikipedia.
Aquí está el código fuente de lo que construí. Algunas de las ideas que utilicé son:
1. Kucera Francis Frecuencia de uso de la palabra
2. tf – idf
- ¿Por qué la gente no ve hyouka el anime?
- ¿Por qué las personas se molestan por las cosas que no les afectan?
- ¿Cuáles son tus malas cualidades que deseas cambiar?
- ¿Por qué guardamos silencio sobre las cosas inmorales y aún nos llamamos sociales y humanos?
- ¿Las personas inteligentes tienen cabezas más grandes de lo habitual?