La Rete degli editori. Modelli di text-mining e network analysis a partire dai dati di aNobii
The Publishers Network. Text-mining and network analysis models based on aNobii dataset
Abstract [ita]
Obiettivo di questo contributo è quello di esaminare e discutere presupposti, metodi e risultati dell’analisi di dati estratti dalla piattaforma di social reading aNobii (http://www.anobii.com/) nell’ambito del progetto “Leggere in rete. Analisi delle pratiche di lettura in ambiente digitale”, in collaborazione tra Università degli Studi di Roma Sapienza e Università degli Studi di Torino. Qui vengono presentati in particolate i risultati relativi all’analisi degli editori a partire non dai classici dati relativi sulla produzione editoriale rilevati annualmente da Istat ma a partire dalle recensioni dei libri lasciare dai lettori sulla piattaforma aNobii. La ricerca è stata condotta secondo due prospettive tra loro integrate: una orientata a definire e visualizzare, in forma di grafo, la rete, degli editori, e si avvale di strumenti ed euristiche situati nel campo della network science; l’altra, a partire dalla segmentazione degli editori realizzata attraverso le metriche di rete, analizza i vocabolari relativi a ciascun editore e ne individua le specificità, attraverso le tecniche dell’analisi automatica dei testi.
Abstract [eng]
This paper aims to examine and discuss methods and results of the analysis of data extracted from the social reading platform aNobii (http://www.anobii.com/). This research is a a part of the project “Read on the Net. Analysis of reading practices in a digital environment” (Leggere in rete. Analisi delle pratiche di lettura in ambiente digitale), in collaboration between the University of Rome Sapienza and the University of Turin. Here we present in particular the results related to the analysis of publishers starting not from the classic data on publishing production reported annually by Istat but starting from the reviews of the books left by readers on the platform aNobii.
The research was conducted according to two integrated perspectives: one oriented to define and visualize, in graph form, the network of publishers using network science; the other, starting from the segmentation of the publishers realized through the network metrics, analyzes the vocabularies related to each publisher and identifies their specificities, through the techniques of text mining.
This journal provides immediate open access to its content on the principle that making research freely available to the public supports a greater global exchange of knowledge.
DigitCult is open access gold. Articles are published under a Creative Commons Attribution (CC BY-NC 4.0) licence to support maximum dissemination and use.
With the licence CC-BY, authors retain the copyright, allowing anyone to download, reuse, re-print, modify, distribute and/or copy their contribution. The work must be properly attributed to its author.
It is not necessary to ask further permissions both to author or journal board.