Comparando os modelos GWS, GBA e G(n,m)

Agora que introduzimos cada um dos modelos clássicos G(n,m), GWS e GBA, faremos um exercício de comparação das redes fictícias geradas por estes modelos. 

Para isso, usamos como base de comparação uma rede real de relações de amizade da plataforma social Facebook. Esta rede foi utilizada em nosso estudo comparando quatro redes complexas que você pode conferir aqui. A rede é não-dirigida e possui 3.898 nós e 137.567 enlaces. Além disso, esta rede é desconexa, portanto usaremos apenas os dados de sua maior componente conectada que possui 99,71% dos nós (3.887) e 99,99% dos enlaces (137.561) da rede original.

A partir desta rede real criamos três redes fictícias utilizando os modelos estudados. Estas redes são equivalentes à rede de coautores - i.e., possuem o mesmo número de nós e densidade aproximadamente a mesma - e avaliamos as três principais propriedades de redes complexas: o tamanho médio do caminho, o coeficiente de aglomeração e a distribuição do grau.

Para geração das redes equivalentes em cada modelo precisamos antes determinar os parâmetros de cada uma delas. 

Para a rede G(n,m), por exemplo, esta determinação é direta já que os parâmetros do modelo são apenas a quantidade de nós e a quantidade de arestas a ser inserida. Note que poderíamos usar uma rede G(n,p), mas nestas redes a densidade é estocástica, por causa do processo de geração dos enlaces, e assim teríamos apenas uma média da quantidade de enlaces ($m = \frac{pn(n-1)}{2}$). Portanto usamos a rede G(n,m) pela garantia de mantermos a densidade da rede igual à da rede original.

No caso do modelo GWS, precisamos determinar os valores de $k$ e $p$. Sabemos que nas redes GWS $k = \frac{2m}{n}$, então para a rede real em questão temos que o valor aproximado de $k$ é $70,78$. Este é um valor racional, contudo o parâmetro $k$ nas redes GWS deve ser inteiro e divisível por 2 (nas redes k-regulares, $k$ é sempre par). Assim, precisamos escolher o valor de $k$ que minimiza o erro absoluto em relação à quantidade de enlaces real. Neste caso, fazendo $k=72$ temos que a quantidade de enlaces é de $139.932$ e a diferença em relação à rede real é de $1.153$ enlaces. Fazendo $k=70$, teremos $136.045$ enlaces e uma diferença de $1.516$ enlaces. Por isso escolhemos esta última.

A respeito do valor de $p$, sabemos que nas redes GWS este parâmetro tem uma relação decrescente e não-linear tanto com o coeficiente de aglomeração quanto com o tamanho médio dos caminhos. Assim, com base em resultados anteriores, decidimos utilizar $p=0,3$, que tende a oferecer um baixo valor de TMC com um valor ainda ainda considerável de $CC$.

Para o modelo GBA, precisamos determinar o valor de $\Delta m$. Para redes grandes como as que estamos tratando, sabemos que a quantidade de enlaces nestas redes é aproximada por $m \simeq n\Delta m$ e podemos fazer, portanto, $\Delta m = m/n$, onde $m$ e $n$ são a quantidade de enlaces e nós da rede real, o que nos dá um $\Delta m$ aproximado de $35,39$. Contudo, novamente temos um problema de arredondamento, já que $\Delta m$ precisa ser inteiro. Assim, usaremos o valor de $\Delta m$ inteiro que minimiza o erro absoluto entre a quantidade de enlaces da rede real e a quantidade de enlaces da rede fictícia. Para $\Delta m = 35$ este erro é de $2.741$ enlaces, enquanto que para $\Delta m = 36$ o erro fica em $1075$ enlaces. Por isso optamos por este último valor.

A tabela abaixo mostra, para a rede real e cada um dos modelos, os resultados do tamanho médio do caminho (TMC), coeficiente de aglomeração ($CC$), grau do Hub ($d_{max}$) e o percentual dos nós com grau maior que três desvios padrão da média ($P(d_i>\lambda+3\sigma)$).

RedeTMC$CC$$d_{max}$
Facebook2,49 0,2631972
G(n,m)2,250,018105
GWS2,480,26187
GBA2,220,054676

Sobre o tamanho médio dos caminhos, percebemos que todos os modelos se aproximam do valor da rede real, sendo que a rede GWS oferece o valor mais próximo de todos. Contudo deve-se observar que este valor é fortemente influenciado pelo valor de da probabilidade de reconfiguração, e que um valor maior para esta probabilidade levaria a uma diminuição do tamanho médio dos caminhos. A despeito das pequenas diferenças, podemos dizer que todos estes modelos conseguem capturar bem o fenômeno de mundos pequenos encontrado na rede real.

Quanto ao coeficiente de aglomeração vemos que apenas a rede GWS consegue capturar esta característica da rede real, obtendo um valor de $CC$ apenas $0,002$ abaixo do valor da rede Facebook. As estratégias adotadas pelos demais modelos, como já sabido (confira os estudos sobre o comportamento do $CC$ nas redes GBA e nas redes G(n,m)), não oferecem um elevado valor de $CC$, e para tivessem um valor comparável ao da rede Facebook seria preciso uma rede de densidade muito maior.  No caso da rede GBA, por exemplo, para obter o mesmo valor de $CC$ da rede Facebook e mantendo a mesma quantidade de nós, seria preciso um $\Delta m$ de aproximadamente $120$. Já na rede G(n,m), seria preciso que a quantidade de enlaces, mantida a quantidade de nós, chegasse a quase dois milhões ($m_{est} = \frac{CC_{Facebook}n^2}{2} = 1.985.633$).

Quanto à distribuição do grau, observamos que o grau do Hub das redes fictícias geradas são inferiores aos da rede Facebook. Este é um resultado esperado para redes G(n,m) e GWS, mas vemos que até mesmo a rede livre de escala gerada pelo modelo GBA tem um $d_{max}$ que é menos da metade do valor encontrado na rede Facebook. Neste caso, ocorre que os modelos para geração de redes fictícias tendem a gerar distribuições do grau mais, digamos "comportadas", onde encontramos a sequência do grau em um continuum, o que não acontece na rede Facebook.

Para entender melhor este argumento, observe a tabela abaixo que mostra o grau dos top-5 nós de maior grau em cada uma das redes. Os valores em cada coluna indicam, para cada rede, o grau do nó de maior grau (hub), depois o grau do segundo nó de maior grau e assim sucessivamente. Este resultado mostra que o grau nas redes fictícias é mais contínuo do que na rede Facebook. 

RankFacebookG(n,m)GWSGBA
#1197210587676
#282410386624
#373210285609
#457410184597
#54519983596

O grau do hub na rede Facebook é mais que o dobro do grau do nó #2 na mesma rede, se comparado ao nó #5 vemos que o hub é 4,3 vezes maior. Já na rede GBA, o grau do hub é apenas 13% maior que o grau do nó #5, o que mostra que a distribuição do grau tem menor dispersão do que a encontrada na rede Facebook. Contudo, deve-se destacar que a rede GBA é livre de escala, diferente das redes G(n,m) e GWS, como podemos ver nos gráficos abaixo que mostram a função de densidade de probabilidade da distribuição do grau em cada ree.


Uma última observação que devemos fazer a este experimento é que os modelos que estudamos nem sempre são suficientemente adequados para explicar todas as propriedades de uma determinada rede real. Porém, tais modelos servem como um bom parâmetro de comparação. 

Se tiver sugestões de novos estudos deixe nos comentários.

Comentários