Rastreamento e visualização de redes sociais: Visualizando redes indiretas a partir de dados georreferenciais

#32

Paulo Victor Barbosa de Sousa
Pablo Vieira Florentino

Sites de redes sociais são usualmente definidos como ambientes eletrônicos em que as pessoas, a partir de um perfil individual, podem tecer articulações entre si, além de visualizar as conexões de outros membros daquele site (Boyd & Ellisson, 2008). Compreendidas como espaços eletrônicos (semi)públicos, redes como Twitter e Facebook têm sido largamente objetos de investigação científica quanto ao que diz respeito a conversações, interações, intercâmbio de mídias, modos de apresentação individual, dentre outras abordagens. Mais possibilidades de pesquisa situam-se alinhadas a um processo composto por coleta, manipulação, visualização e análise de dados extraídos desses ambientes, compondo um banco de dados difuso de rastros digitais. Por meio de APIs (Application Program Interface) e softwares de monitoramento e análise de redes sociais, é possível realizar extrações e interpretações sobre os dados de alguns desses ambientes eletrônicos. Essas técnicas compõem os procedimentos para aplicação de técnicas de Análise de Redes Sociais (ARS), que permitem diferentes formas de investigar, visualizar e quantificar as relações e os elementos que compõem uma rede a partir de medidas estatísticas baseadas nas relações que a formam (Wasserman & Faust, 1994). Com estas medidas, é possível categorizar as redes e inferir sobre sua estrutura e comportamento.
Os rastros digitais são variados e correspondem a diversas informações e práticas dos usuários. A partir do tratamento e da modelagem desses dados, é possível visualizar manifestações diversas dos usuários desses serviços bem como fazer inferências diversas sobre eles: que elementos identitários carregam, o que publicam, que palavras-chave utilizam, quais seus posicionamentos sobre determinadas controvérsias, com quais outros usuários interagem ou ainda como se articulam em rede para consumir e repassar notícias ou demais atualizações de status. Como resultado, é possível visualizar conversações e narrativas geridas a partir do uso de palavras-chave (Malini, 2010) ou ainda mensurar e qualificar aspectos diversos das redes formadas ao redor de hashtags no Twitter (Recuero, 2014). São poucas e recentes, contudo, investigações que lidem com redes sociais e dados georreferenciais - que, em poucas palavras, atribuem às publicações uma localização geográfica relacionada a um determinado instante utilizando um software social. Destacam-se iniciativas como as de Cranshaw et al. (2010), que buscam visualizar a complexidade da vida urbana tendo por base os rastros deixados em redes sociais baseadas na localização; Bastos et al. (2014), que exploram a localização geográfica de tweets durante protestos realizados no Brasil no ano de 2013; Silva et al. (2013), que realizam um sensoriamento do Instagram em relação às marcações geográficas; Nabian et al. (2013), que exploram modos de produção de dados relacionados à prática espacial urbana; e Florentino, Rocha & Corso (2014), que utilizam análise de redes para compreender dinâmicas de conversações relacionadas a espaços públicos.
Notoriamente, o uso e produção de dados georreferenciais passou a ter uma relação mais direta com as redes sociais a partir do surgimento e ampla adoção de location based social networks - LBSN (Sutko & de Souza e Silva, 2011), o que tirou o dado georreferencial de uma posição de restrição ao campo da geografia e o colocou em conexão mais clara com as interações mediadas por dispositivos eletrônicos, com a computação e com a cultura digital como um todo. As LBSN - ou, em livre tradução, redes sociais baseadas em localização - são serviços que, a partir do uso de aplicativos instalados em smartphones e tablets, permitem marcações e/ou buscas espaciais por seus utilizadores. Nesse tipo de rede, a exemplo do Foursquare, as pessoas dizem deliberadamente onde elas se encontram em determinado momento. Dessa forma, além de disponibilizarem publicamente suas localizações temporárias, elas podem avaliar estabelecimentos e locais públicos (e checar as avaliações feitas por outros), procurar e descobrir novos lugares para visitar e até tecer articulações entre si, como encontrar-se com (ou evitar os) amigos ou estranhos pelas proximidades. Essas marcações, geralmente chamadas de check-in, ficam alocadas em mapas e históricos pessoais (mas muitas vezes visíveis publicamente), e não raro são também disponibilizadas automaticamente como atualizações de status em outros sites de redes sociais (como os já citados Facebook ou Twitter). Uma vez que as LBSN estão baseadas em movimentações no tempo e no espaço e tomam a dimensão locativa como elemento-chave de utilização e de interação social, faz sentido percebê-las, tendo em vista seus usos e apropriações, como indicativos de práticas culturais diversas. Os rastros digitais deixados publicamente nos sistemas e nas redes acabam sendo algumas das fontes possíveis para a captura e observação de práticas sociais variadas.
Buscando encontrar relações específicas entre as pessoas que utilizam LBSN e suas práticas espaciais, o presente artigo utiliza-se de uma base de dados de mais de 3 gigabytes extraída da integração entre Twitter e Foursquare e disponibilizada publicamente (Cheng, Caverlee & Lee, 2011). Os dados aqui utilizados dão conta de milhares de marcações georreferenciais realizadas entre os anos de 2010 e 2011 e correspondentes a todo o globo terrestre (com notória concentração nos EUA e na Europa). Utilizamos aqui a ARS como método voltado ao estudo das relações entre as pessoas e suas práticas espaciais. Do ponto de vista das técnicas da ARS, os dados extraídos podem ser classificados como uma rede de dois modos (ou duas categorias, A e B) (Latapy et al., 2008), sendo (A) a categoria dos usuários da rede e (B) a categoria formada pelos lugares visitados pelos usuários (mapeados pelo Foursquare). Segundo os conceitos de ARS, nas redes de dois modos, elementos de uma determinada categoria não estabelecem relações diretas entre si, mas somente com a categoria oposta. No entanto, nosso objetivo é, a partir desses dados, obter modelagens capazes de prover inferências sobre como as pessoas que frequentam um mesmo lugar - ou seja, que possuem práticas espaciais similares - podem estar relacionadas indiretamente entre si. Partindo dos dados sobre as relações diretas entre as pessoas e os lugares que elas frequentam (rastros digitais deixados pelos check-Ins que realizam em softwares sociais, como o Foursquare), buscamos explorar as relações não explícitas entre as diversas pessoas por frequentarem um dado lugar, mesmo que elas não possuam elos imediatos entre si (elas podem não se conhecer, por exemplo, ou apenas não ter estabelecido laços sociotécnicos nos diversos ambientes digitais). Assim, seguindo a teoria de ARS, buscamos modelar primeiramente a rede de dois modos para, a partir desta, identificar as redes de somente um modo - por exemplo, as redes de usuários (Latapy et al., 2008).
Com esse estudo de caráter experimental, buscamos evidenciar a formação de redes baseadas na localização dos usuários, que se caracterizam por serem redes indiretas entre seus elementos participantes, geradas a partir dos dados de check-In realizados pelos mesmos. Nossa hipótese principal nos diz que, com os rastros digitais coletados, poderemos visualizar uma rede de pessoas orientada pelos lugares e pela prática espacial, e não pelos elos diretos entre os indivíduos. A partir da modelagem efetuada, veremos como as pessoas se relacionam indiretamente entre si pela mediação informacional do lugar e como o espaço, a partir de uma camada de dados georreferenciais, atravessa (mais do que é atravessado) distintos indivíduos, atuando como um elo entre eles. Teremos daí a possibilidade de conhecer e/ou inferir informações sobre grupos de usuários com hábitos urbanos semelhantes, tanto quanto perceber como as práticas no espaço são postas em circulação em distintas redes de pessoas. Com estas redes definidas, será possível identificar e investigar os perfis que se aproximam pela prática locativa na cidade e explorar traços em comum dos mesmos, como por exemplo: sexo, idade, cidade onde residem, temas de interesse, entre outros. Esse procedimento expõe o dado geográfico como um elemento de aglutinação e correlações entre distintas pessoas e mostra, parcialmente, como os lugares e a prática espacial estão sendo complexificados, ampliados e expandidos com o uso de tecnologias comunicacionais eletrônicas. Sublinhamos, assim, a importância da informação geográfica como elemento de aglutinação social e produtor potencial de sociabilidade, bem como um dado de grande relevância na cultura digital contemporânea a perspassar transversalmente outros tipos de dados.
Como discussão final, buscamos notar que o rastreamento de dados digitais aponta para a possibilidade de práticas de vigilância por meio da identificação “indireta” de relações entre os usuários, representadas e modeladas pelos dados dos softwares de redes sociais. Com estes dados, é possível correlacionar usuários destas redes através dos locais que os mesmos frequentam e realizam check-in. O que nos interessa, nesse ponto, é colocar em evidência as particularidades e possibilidades de análise da informação geográfica posta em rede, bem como seu caráter social, e não exatamente como ela é produzida ou apreendida pelas pessoas. Há implicações possíveis quanto à privacidade dos usuários, por exemplo: ainda que estejamos lidando com dados postos a público a partir da própria iniciativa dos indivíduos, nossa experiência mostra, a posteriori, como o uso de dados georreferenciais pode estar implicado num processo de identificação de perfis previamente anonimizados - o que pode ser virtualmente efetuado tanto por órgãos policiais quanto por empresas particulares. A discussão subjacente indica que, sendo um elemento conceitual praticado e construído no cotidiano, a localização espacial encontra-se atrelada a indivíduos e coletivos e, como tal, atravessa redes de camadas sociais e técnicas.

Palavras-chave: localização, mobilidade, monitoramento, redes sociais.

Referências:
Boyd, D. & Ellison, N. (2007). Social network sites: Definition, history, and scholarship. Journal of Computer-Mediated Communication, 13(1).
Bastos, M. T. et al. (2014). Taking Tweets to the streets: A spatial analysis of the Vinager Protests in Brazil. First Monday, 19, 1-18.
Cheng, Z. et al. (2011). Exploring Millions of Footprints in Location Sharing Services. Proceedings of the Fifth International AAAI Conference on Weblogs and Social Media.
Cranshaw, J. et al. (2012). The Livehoods Project: Utilizing Social Media to Understand the Dynamics of a City. Proceedings of the Sixth International AAAI Conference on Weblogs and Social Media.
Florentino, P. et al. (2014). Digital Social Networks and Urban Spaces. Revista TEMA, 1, 403-415.
Latapy et al. (2008). Basic notions for the analysis of large two-mode networks. Social Networks, 30(1), 31-48.
Malini, F. (2010). Narrativas no Twitter: o fenômeno no Brasil e as suas implicações na produção da verdade. Lugar Comum, 31, 121-142.
Nabian, N. et al. (2013). Data dimension: accessing urban data and making it accessible. Proceedings of the ICE - Urban Design and Planning (p.60-75), 166 (1).
Recuero, R. (2014). Contribuições da Análise de Redes Sociais para o estudo de redes sociais na Internet: o caso da hashtag #Tamojuntodilma e #CalaabocaDilma. Fronteiras - Estudos Midiáticos, 16 (2), 60-70.
Silva, T. et al. (2002). Uma Fotografia do Instagram: Caracterização e Aplicação. Anais do 31º Simpósio Brasileiro de Redes de Computadores e Sistemas Distribuídos (p.455-468), Belo Horizonte.
Sutko, D. M.; De Souza e Silva, A. (2011). Location-aware mobile media and urban sociability. New Media & Society, 13, 807-823.
Wasserman, S. & Faust, K. (1994). Social Network Analysis: Methods and Applications. Cambridge: Cambridge University Press, 1994.