Plots2: Remova "-" antes de contar as postagens nos cartões de tópico ao classificar por "# de pessoas"

Criado em 28 mai. 2020  ·  25Comentários  ·  Fonte: publiclab/plots2

Descreva o problema

Parece haver um minúsculo "-" antes da contagem de postagens nos Cartões de Tópico quando a opção de classificação "Número de Pessoas" é clicada, fazendo parecer que há uma contagem negativa de postagens. Veja a imagem:

Screen Shot 2020-05-20 at 10 36 42 AM (1)

O que você esperava ver e não viu?

eu esperava ver números inteiros positivos.

Por favor, mostre-nos onde procurar

https://publiclab.org/tags?sort=followers&order=asc

Qual é o seu nome de usuário PublicLab.org?

Isso pode nos ajudar a diagnosticar o problema:

liz

bug

Comentários muito úteis

Ei @ebarry , acho que esse é um problema mais sério, na verdade: sweat_smile: fiz alterações para isso aqui https://github.com/publiclab/plots2/pull/7609, mas devo ter confundido e calculado a contagem errada I pense: desapontado: Looping em @jywarren Desculpe, talvez precise de alguma ajuda para consertar isso: sweat_smile:

Todos 25 comentários

Alguém tem links de código em mãos que possam adicionar aqui? Desde já, obrigado!

Ei @ebarry , acho que esse é um problema mais sério, na verdade: sweat_smile: fiz alterações para isso aqui https://github.com/publiclab/plots2/pull/7609, mas devo ter confundido e calculado a contagem errada I pense: desapontado: Looping em @jywarren Desculpe, talvez precise de alguma ajuda para consertar isso: sweat_smile:

Olá @Tlazypanda, podemos dar uma olhada em outros lugares onde o código do tipo Tag.counter é usado e tentar mudar para isso?

https://github.com/publiclab/plots2/pull/7609/files#diff -8fe92870a7f027a46eed82a51c5c16bcR118

No entanto, a contagem está muito pequena. Eu me pergunto se isso é um problema de algumas coisas serem spam e isso afetando um pouco a matemática?

Veja, por exemplo, a diferença entre essas contagens:

image

image

Podemos procurar onde a contagem de 236 é calculada e mudar para isso, talvez?

Então, isso usa uma variável de instância gerada pelo controlador:

https://github.com/publiclab/plots2/blob/c056cb0b97ebc6b34184ec3dfa9a83e1096395f9/app/views/tag/show.html.erb#L58

Eu acredito que é aqui que isso é calculado:

https://github.com/publiclab/plots2/blob/c056cb0b97ebc6b34184ec3dfa9a83e1096395f9/app/controllers/tag_controller.rb#L551 -L560

Ei @jywarren , o que posso ver em tag /: id, ou seja, a página de exibição para tag é que estamos exibindo apenas notas de pesquisa ali e em cartões de tópico, estamos tentando exibir notas de pesquisa + perguntas.
Então, acho que o que precisamos fazer é buscar as notas da mesma maneira que estamos fazendo na tag # show e para exibir a contagem na parte inferior do cartão de tópico, precisaremos apenas usar esta expressão matemática:
Número de notas com o tagname-Contagem de notas exibidas no cartão de tópico

precisamos buscar notas da mesma maneira que estamos fazendo na tag # show

Oi, isso mesmo! observando o conceito de uma "única fonte da verdade" aqui: https://github.com/publiclab/plots2/issues/6855#issuecomment -578331475

Acredito que devemos usar os mesmos cálculos aqui: https://github.com/publiclab/plots2/pull/7476 (com base em # 6855).

@ urvashigupta7 muito obrigado por participar! Você estaria interessado em fazer essas alterações?

Também acho que em https://github.com/publiclab/plots2/pull/7476/ , não estamos filtrando spam. Portanto, nessas linhas, provavelmente devemos adicionar .where(status: 1) :

https://github.com/publiclab/plots2/blob/c056cb0b97ebc6b34184ec3dfa9a83e1096395f9/app/controllers/tag_controller.rb#L551 -L560

Esse código também depende disso, que não filtra spam:

https://github.com/publiclab/plots2/blob/f4dfdcbae4dfa60b0ec357081ee1fae6f2089436/app/models/node.rb#L609 -L618

Da mesma forma, este código também precisa filtrar o spam com o mesmo filtro:

https://github.com/publiclab/plots2/blob/f4dfdcbae4dfa60b0ec357081ee1fae6f2089436/app/models/tag.rb#L118 -L124

Hmm. Parece que estamos filtrando spam a partir do cálculo @total_posts , conforme ele é executado / após / estas linhas:

https://github.com/publiclab/plots2/blob/c056cb0b97ebc6b34184ec3dfa9a83e1096395f9/app/controllers/tag_controller.rb#L204 -L218

No entanto, nem Tag.counter e Node.for_tagname_and_type filtram. Talvez seja essa a irregularidade?

A contagem aqui ainda não está certa, eu acho. Por exemplo https://stable.publiclab.org/tags agora lista 692 postagens para balloon-mapping mas aqui estão as estatísticas para essa tag (no estável):

image

Acho que precisamos depender dessa correção: https://github.com/publiclab/plots2/pull/8245

então podemos verificar isso novamente. Reabrindo por um momento ... dedos 🤞

https://github.com/publiclab/plots2/pull/8245 está pronto! E tem testes de unidade, tão bom. OK, agora isso pode funcionar ...

OK, diz 573 posts » - hmm

Notas de pesquisa 469
Questões 37
Páginas do Wiki 77
Pessoas 346

Quero dizer, notas mais wikis = 546 ...? e mais perguntas é 583?

Agora, testando a tag tests no stable, suspeito que pode haver algum cache. Adicionar essa tag a uma nova nota, https://stable.publiclab.org/notes/aidanswope/05-21-2019/angel-s-point-balloon-map-updated , não resultou na guia de notas indo de 7 a 8, embora tag.count retorne 8, assim como o resultado de tag.run_count

https://stable.publiclab.org/tag/tests

OK, rastreando a contagem de guias:

https://github.com/publiclab/plots2/blob/e97eff7464a544a97f4b38f169f76250600b3148/app/models/node.rb#L621 -L630

Node.where(status: 1, type: 'note').includes(:revision, :tag).references(:term_data, :node_revisions).where('term_data.name = ? OR term_data.parent = ?', 'balloon-mapping', 'balloon-mapping').where.not(nid: qids).count => 470

Versus a contagem de cartas de tópico:

NodeTag.joins(:node).where(tid: 10).where('node.status = 1 AND node.type = "note"').where.not(nid: qids).count => 467

😭

Esses três são a diferença: [6129, 7236, 7414] -

[#,

,

]

Muito estranho! por 2 motivos: 3 notas não são o mesmo que as 10 que faltam (embora não tenhamos visto as perguntas ainda), E, ​​essas três parecem ser normais, exceto que uma foi em fevereiro de 2013 e 2 foram em maio de 2013:

(atualização: veja abaixo para tagnames duplicados)

Também interessante:

Node.where(status: 1, type: 'note').includes(:revision, :tag).references(:term_data, :node_revisions).where('term_data.name = ? OR term_data.parent = ?', 'balloon-mapping', 'balloon-mapping').where(nid: qids).count => 29

Isso está de acordo com:

NodeTag.joins(:node).where(tid: 10).where('node.status = 1 AND node.type = "note"').where(nid: qids).count

vs. 37, conforme mostrado na guia, que é calculado com:

https://github.com/publiclab/plots2/blob/e97eff7464a544a97f4b38f169f76250600b3148/app/models/node.rb#L640 -L646

Aha! A última seção mostra que as postagens com a tag question:balloon-mapping estão incluídas nessa contagem, mesmo que não tenham a tag balloon-mapping !!!

As 8 postagens a seguir parecem ter question:balloon-mapping mas não balloon-mapping :

[13556, 15762, 16426, 18994, 20694, 11301, 12251, 19625]

OK, isso nos leva a 2 nós. Agora vamos comparar manualmente:

irb(main):040:0> NodeTag.joins(:node).where(tid: 10).where('node.status = 1 AND node.type = "note"').count
=> 496
irb(main):041:0> Node.where(status: 1, type: 'note').includes(:tag).references(:term_data).where('term_data.name = ?', 'balloon-mapping').count
=> 499
irb(main):022:0> Node.where(status: 1, type: 'note').includes(:revision, :tag).references(:term_data, :node_revisions).where('term_data.name = ? OR term_data.parent = ?', 'balloon-mapping', 'balloon-mapping').collect(&:nid)
=> [146, 253, 254, 268, 403, 511, 724, 732, 743, 913, 1482, 1489, 1620, 1626, 1627, 1632, 1715, 1849, 1968, 1994, 2126, 2138, 2144, 2476, 2589, 2930, 3115, 3325, 4649, 4952, 5038, 5220, 5250, 5978, 6934, 7050, 7189, 7294, 7314, 7491, 7577, 7593, 7995, 8189, 8907, 8913, 8914, 8950, 9019, 9032, 9042, 9086, 9417, 9434, 9742, 9888, 9977, 10541, 11019, 11100, 11223, 11574, 11582, 11827, 12201, 12240, 12491, 12619, 12708, 13095, 13424, 13945, 14022, 14095, 14183, 14185, 14219, 14515, 14572, 14587, 14597, 14600, 14611, 14620, 14813, 14907, 14909, 14983, 15545, 15568, 16591, 16653, 16746, 16877, 18316, 19153, 19272, 19462, 19558, 19578, 19620, 19762, 20331, 23549, 24101, 24102, 1795, 6635, 347, 369, 439, 444, 792, 861, 1665, 1668, 1962, 2135, 2143, 2152, 2245, 2277, 2783, 2784, 3563, 3635, 3670, 4482, 4516, 4755, 4760, 4923, 4925, 6059, 7641, 10181, 10489, 11101, 11724, 13243, 13880, 13948, 17322, 64, 166, 202, 344, 1666, 1816, 1818, 1819, 2919, 3354, 3736, 3821, 4087, 8020, 8947, 9301, 11199, 11260, 11261, 11755, 12161, 1544, 1739, 1742, 1892, 2006, 5494, 9353, 10705, 828, 1515, 1786, 1877, 1926, 1949, 2121, 2625, 2666, 2677, 2846, 2892, 2961, 4092, 4907, 5394, 5415, 5664, 7132, 7367, 7368, 7717, 7964, 8400, 10243, 6175, 9507, 4636, 6293, 3014, 6624, 9806, 10289, 10554, 11278, 11391, 12104, 12622, 12894, 13143, 9935, 10036, 10196, 10450, 11283, 11719, 11769, 12237, 10246, 10605, 2462, 9497, 1889, 2131, 2443, 3026, 4127, 4252, 4673, 5538, 5893, 6608, 8034, 8902, 8959, 9644, 9707, 10045, 10162, 10335, 10336, 10337, 10373, 10540, 10570, 11107, 11110, 11112, 11124, 11143, 11175, 11298, 11336, 12053, 12203, 12590, 16984, 19515, 19580, 23822, 2163, 3634, 7620, 10166, 11056, 11319, 11589, 1541, 1652, 1676, 1677, 1746, 2154, 2237, 2275, 2311, 2623, 2785, 3454, 3652, 3822, 4014, 4691, 4720, 4950, 5161, 7785, 8866, 8926, 8928, 8937, 8958, 8986, 9759, 9915, 10101, 10230, 10244, 10302, 10311, 10374, 10523, 10602, 11021, 11078, 11103, 11253, 11726, 11988, 12686, 12752, 12757, 13400, 13845, 14116, 14660, 14713, 14756, 1716, 2660, 7191, 7192, 1743, 1636, 1900, 9317, 10651, 1741, 13904, 3096, 2352, 2824, 4091, 2715, 6080, 6082, 2732, 3801, 3908, 4545, 7121, 10284, 13791, 10631, 4921, 6751, 9429, 9743, 11577, 17331, 6073, 9858, 10711, 11118, 6525, 10267, 9034, 11252, 11268, 8033, 8868, 10159, 10214, 9027, 9785, 9033, 9076, 9299, 14501, 14508, 14562, 21733, 10282, 9909, 11178, 11738, 10024, 12667, 11262, 11343, 11978, 11983, 11992, 11826, 11061, 10227, 10428, 11077, 11131, 11137, 11280, 11281, 11518, 11551, 11807, 11812, 11947, 12039, 14158, 14729, 14943, 15641, 16273, 16349, 18560, 19269, 19286, 21547, 10343, 14852, 14901, 15352, 15387, 10612, 10638, 10986, 10994, 20181, 11002, 11127, 11128, 11183, 12166, 11342, 11494, 11955, 11673, 11707, 11711, 12190, 18839, 13802, 14595, 12227, 15912, 14007, 13093, 13096, 12981, 13102, 13160, 13194, 13196, 13227, 13242, 13267, 13278, 13281, 13298, 14168, 15161, 23143, 14058, 14766, 13748, 13839, 15603, 14241, 14179, 14239, 14246, 14240, 14255, 14488, 14487, 14245, 14785, 15160, 14703, 14995, 16571, 15172, 15179, 15424, 15713, 15732, 16141, 16284, 16334, 16382, 17387, 17498, 17499, 18498, 16960, 19689, 17815, 19394, 19464, 19650, 19955, 19476, 19477, 23203, 6129, 7236, 7414]

vs:


irb(main):024:0> NodeTag.joins(:node).where(tid: 10).where('node.status = 1 AND node.type = "note"').collect(&:nid)
=> [146, 253, 254, 268, 403, 511, 724, 732, 743, 913, 1482, 1489, 1620, 1626, 1627, 1632, 1715, 1849, 1968, 1994, 2126, 2138, 2144, 2476, 2589, 2930, 3115, 3325, 4649, 4952, 5038, 5220, 5250, 5978, 6934, 7050, 7189, 7294, 7314, 7491, 7577, 7593, 7995, 8189, 8907, 8913, 8914, 8950, 9019, 9032, 9042, 9086, 9417, 9434, 9742, 9888, 9977, 10541, 11019, 11100, 11223, 11574, 11582, 11827, 12201, 12240, 12491, 12619, 12708, 13095, 13424, 13945, 14022, 14095, 14183, 14185, 14219, 14515, 14572, 14587, 14597, 14600, 14611, 14620, 14813, 14907, 14909, 14983, 15545, 15568, 16591, 16653, 16746, 16877, 18316, 19153, 19272, 19462, 19558, 19578, 19620, 19762, 20331, 23549, 24101, 24102, 1795, 6635, 347, 369, 439, 444, 792, 861, 1665, 1668, 1962, 2135, 2143, 2152, 2245, 2277, 2783, 2784, 3563, 3635, 3670, 4482, 4516, 4755, 4760, 4923, 4925, 6059, 7641, 10181, 10489, 11101, 11724, 13243, 13880, 13948, 17322, 64, 166, 202, 344, 1666, 1816, 1818, 1819, 2919, 3354, 3736, 3821, 4087, 8020, 8947, 9301, 11199, 11260, 11261, 11755, 12161, 1544, 1739, 1742, 1892, 2006, 5494, 9353, 10705, 828, 1515, 1786, 1877, 1926, 1949, 2121, 2625, 2666, 2677, 2846, 2892, 2961, 4092, 4907, 5394, 5415, 5664, 7132, 7367, 7368, 7717, 7964, 8400, 10243, 6175, 9507, 4636, 6293, 3014, 6624, 9806, 10289, 10554, 11278, 11391, 12104, 12622, 12894, 13143, 9935, 10036, 10196, 10450, 11283, 11719, 11769, 12237, 10246, 10605, 2462, 9497, 1889, 2131, 2443, 3026, 4127, 4252, 4673, 5538, 5893, 6608, 8034, 8902, 8959, 9644, 9707, 10045, 10162, 10335, 10336, 10337, 10373, 10540, 10570, 11107, 11110, 11112, 11124, 11143, 11175, 11298, 11336, 12053, 12203, 12590, 16984, 19515, 19580, 23822, 2163, 3634, 7620, 10166, 11056, 11319, 11589, 1541, 1652, 1676, 1677, 1746, 2154, 2237, 2275, 2311, 2623, 2785, 3454, 3652, 3822, 4014, 4691, 4720, 4950, 5161, 7785, 8866, 8926, 8928, 8937, 8958, 8986, 9759, 9915, 10101, 10230, 10244, 10302, 10311, 10374, 10523, 10602, 11021, 11078, 11103, 11253, 11726, 11988, 12686, 12752, 12757, 13400, 13845, 14116, 14660, 14713, 14756, 1716, 2660, 7191, 7192, 1743, 1636, 1900, 9317, 10651, 1741, 13904, 3096, 2352, 2824, 4091, 2715, 6080, 6082, 2732, 3801, 3908, 4545, 7121, 10284, 13791, 10631, 4921, 6751, 9429, 9743, 11577, 17331, 6073, 9858, 10711, 11118, 6525, 10267, 9034, 11252, 11268, 8033, 8868, 10159, 10214, 9027, 9785, 9033, 9076, 9299, 14501, 14508, 14562, 21733, 10282, 9909, 11178, 11738, 10024, 12667, 11262, 11343, 11978, 11983, 11992, 11826, 11061, 10227, 10428, 11077, 11131, 11137, 11280, 11281, 11518, 11551, 11807, 11812, 11947, 12039, 14158, 14729, 14943, 15641, 16273, 16349, 18560, 19269, 19286, 21547, 10343, 14852, 14901, 15352, 15387, 10612, 10638, 10986, 10994, 20181, 11002, 11127, 11128, 11183, 12166, 11342, 11494, 11955, 11673, 11707, 11711, 12190, 18839, 13802, 14595, 12227, 15912, 14007, 13093, 13096, 12981, 13102, 13160, 13194, 13196, 13227, 13242, 13267, 13278, 13281, 13298, 14168, 15161, 23143, 14058, 14766, 13748, 13839, 15603, 14241, 14179, 14239, 14246, 14240, 14255, 14488, 14487, 14245, 14785, 15160, 14703, 14995, 16571, 15172, 15179, 15424, 15713, 15732, 16141, 16284, 16334, 16382, 17387, 17498, 17499, 18498, 16960, 19689, 17815, 19394, 19464, 19650, 19955, 19476, 19477, 23203]

Aha. Talvez isto:

Tag.where(name: 'balloon-mapping').length => 4
Tag.where(name: 'balloon-mapping').collect(&:tid) => [10, 3205, 3591, 4032]

Sim, essa é a discrepância:

irb(main):045:0> NodeTag.joins(:node).where(tid: [10, 3205, 3591, 4032]).where('node.status = 1 AND node.type = "note"').count
=> 499
irb(main):046:0> Node.where(status: 1, type: 'note').includes(:tag).references(:term_data).where('term_data.name = ?', 'balloon-mapping').count
=> 499

irb(main):050:0> Tag.where(name: 'balloon-mapping').collect(&:count)
=> [574, 1, 1, 1]

No entanto, notavelmente não para os method ou project bugs em # 7334

irb(main):047:0> Tag.where(name: 'method').collect(&:tid)
=> [14474]
irb(main):048:0> Tag.where(name: 'project').collect(&:tid)
=> [14751]

OK, consertei as tags duplicadas com:

irb(main):053:0> NodeTag.where(tid: [3205, 3591, 4032]).each do |nt|
irb(main):054:1* nt.tid = 10
irb(main):055:1> nt.save
irb(main):056:1> end

no entanto, aposto que há mais no banco de dados. Podemos querer fazer um projeto maior para consolidá-los.

Atualização: sim, existem 28 outras instâncias:

irb(main):063:0> Tag.count
=> 18532
irb(main):065:0> Tag.all.collect(&:name).uniq.count
=> 18504


irb(main):069:0> (Tag.all - Tag.all.group(:name)).collect(&:name)
=> ["fold-up", "gulf-coast", "kite-mapping", "gulf-coast", "brooklyn", "new-york-city", "balloon-mapping", "spectrometer", "farmhack", "white-balance", "fresh-kills", "balloon-mapping", "balloon-mapping", "kite-mapping", "newsletter", "newsletter", "passenger-pigeon", "jamaica-bay", "mobile-spectrometer", "infragram-sandbox", "mailing-lists", "diy-kite", "water-sensing", "carbon-arc", "diy-kite", "diy-kite", "workplace", "emergencies"]

Minha recomendação agora é:

Nós reduzimos muito isso e ele tem duas partes.

  1. Tags “fantasmas” - tagnames duplicados, então basicamente alguns não estavam sendo contados (resolvido, embora existam cerca de 15 outras ocorrências para algumas outras tags)
  2. question:_____ tags de formato, que são contados na guia de perguntas nas páginas /tag/____ , mas se não tiverem sua própria tag de base, não são contados nos cartões de tópico. Exemplo: 8 postagens têm question:balloon-mapping mas não balloon-mapping , então eles jogam nossa contagem em 8.

Minha opinião sobre (2) é que devemos escrever e estar cientes disso, mas não resolvê-lo (não consigo pensar em uma solução limpa de qualquer maneira).

E, mesmo depois de toda essa escavação, ainda tenho uma discrepância de 1 para balloon-mapping . Mas acho que estamos tão perto que devemos essencialmente concordar com isso, já que é uma das maiores marcas e é improvável que o problema afete outras pessoas. Interessado em ouvir a opinião dos outros sobre isso também!

Esta página foi útil?
0 / 5 - 0 avaliações