许多旧房间,例如 /helpBonfires 现在已弃用,但露营者仍然加入其中。 我们需要一个获得此 repo 写入权限的贡献者,通过运行以下命令来查看和更新这些房间的主题:
/topic This room is inactive, and only exists for archival purposes. Join some active rooms - here's the full list: https://www.freecodecamp.com/wiki/en/official-free-code-camp-chat-rooms/
房间通知
遗漏了城市特定的房间。
@QuincyLarson我认为应该是这样。
PS 我刚刚意识到我们有 540 个房间,通过这次审计。
其中一些真的很有趣,一些被创造出来并被遗忘了。
添加:
干得好!
@sludge256 @raisedadead实际上,我认为我们需要对不在我们官方房间列表中的每个房间都这样做(除非它在过去 3 天内碰巧有重大活动)。
检查了大多数房间,所有没有任何活动(一个多月)的房间都没有被触及(只是因为它会引发他们的讨论)。
露营地的房间不需要这个,他们已经有一个消息,上面的内容也适用于所有人。
关闭。
@raisedadead我们已停止使用 fcc wiki。 弃用的房间是否指向论坛中的相应帖子?
@伯克利真
我已经更新了主题。
他们仍然在聊天消息中链接到维基,我可以更新,只是不想触发通知。 考虑到大多数最近没有活动,最好保持原样。
然而,Ziplines 和 Bonfires 有时会吸引访客,因为 Gitter 将它们显示为建议的房间。
@raisedadead @BerkeleyTrue我们实际上可能只想删除已弃用的房间。 很少会被遗漏,这样,Gitter 的本地发现功能就会正常工作。 我们不必列出我们的官方房间——我们只有官方房间(所有非官方的其他房间将由露营者自己管理,而不是在 freecodecamp 前缀下。
缺点:我们丢失了一些历史记录和少量的 Google 搜索结果
好处:聊天室变得更容易向人们解释。
随着论坛的成功,我的目标是将 Gitter 上间歇性发生的大量交流转移到论坛上,在那里期望可能需要几天时间才能得到回应。
许多聊天室都是鬼城——因此我们经常修剪或弃用它们。
我们需要通过官方房间,看看哪些是活跃的。
是的,我同意。 我认为最好的好处是删除它们。 将进行审核并发布可以/必须删除的列表。
许多:> 100/天
一些:> 10/天,< 100/天,
少数:< 10/天
无效:今天没有帖子
FreeCodeCamp - 许多
帮助- 很多
帮助JavaScript - 许多
HelpFrontEnd - 许多
HelpDataViz - 一些
HelpBackEnd - 一些
Python - 很少
Java - 很少
红宝石- 不活动
PHP - 很少
去- 不活动
长生不老药- 不活跃
.NET - 不活动
C++ - 不活动
流浪者- 不活跃
Git - 不活动
Linux - 不活动
SQL - 不活动
CodeReview - 许多
YouCanDoThis - 很少
编码工作- 很多
休闲- 一些
课程开发- 一些
数据科学- 一些
阿尔巴尼亚语- 不活跃
阿拉伯语- 很少
中国人- 许多
荷兰语- 不活跃
德语- 不活跃
法语- 不活跃
日语- 不活动
韩语- 不活跃
波斯语- 不活跃
葡萄牙语- 不活跃
罗马尼亚语- 不活跃
俄语- 很少
西班牙语- 一些
瑞典语- 不活跃
他加禄语- 不活动
泰语- 不活跃
越南语- 不活跃
我们的社区主要分布在 3 个地方:
就其价值而言,以下是我对这些媒介中的每一种的看法:
在这三个中,聊天室建立了最紧密的联系。 与人实时交谈令人振奋,离开聊天室可能很难。 这就是说,聊天室受“鬼城”的影响远不止论坛或 Facebook 群组。 一旦聊天室中的事情平息下来,就很难重新开始对话。
通过将尽可能多的聊天室社区集中到几个关键房间,我们降低了鬼城的风险。
问题是我们要保留哪些房间?
基于以上研究,我虚心建议我们:
我很高兴听到每个人对此的想法。
我看到了你提议的清单和你邀请讨论像 DataScience 这样的聊天室的未来。 我认为这个房间不适合“一般房间”格式:那里发生的讨论主要是关于数据科学。 将那个房间合并到另一个更一般的房间可能会扼杀房间的当前内容和动机,除非它与具有类似意图的房间合并。 像“贡献者”这样的房间看起来并不是这个房间的最佳标题。 我也可以说它很吸引人:房间目前有 680 名订阅者,有些人正在监视活动。
就像现在一样,我认为这个房间的性质和所涉及的活动不适合论坛形式。
我只能谈谈这个房间,因为它是我从成立以来一直管理的房间。
我还监控了 Python 房间的活动:不是“少数”而是“一些”。 然而,这是一个房间,由于其性质,可以搬到其他地方。
西班牙房间也是我见过的最活跃的房间之一...那里的人非常善于维护房间的活动。
这也不适合论坛格式。
如果你认为未来是删除那些房间,我认为西班牙人会受到删除 HelpDataViz、HelpJavaScript 等相关房间的影响。房间。 一旦您删除与帮助相关的房间并将活动移至论坛,西班牙房间可能无法生存或减少其活动。 如果 Gitter 的活动总体上减少,西班牙房间可能会消失。
我建议如下:
对于某些具有“某种”活动级别的项目,在删除其他可能相关的房间后,要么合并,要么等着看它们会发生什么。
我认为删除关于 Help- 的房间只会减少 Gitter 的整个活动,因为 Gitter 将不再是对帮助资源集的引用。
在删除其他可能相关的房间后,要么合并,要么等着看他们会发生什么。
@evaristoc刚刚想出了一个好主意。 与其立即做出重大改变,不如让我们逐步进行这些改变。
首先,我们可以关闭其他语言的聊天室(不是
如果反馈非常消极,那么我们将重新考虑关闭房间的整个想法。
@昆西拉森
如果实际计划是无论活动如何都删除它们,我建议为与主要主持人交谈的用户提供以下替代方案:
至少,要防止用户有足够的时间“将他们的东西移到其他地方”。
我的理解是:
DataScience、西班牙语、俄语、中文、休闲不是 Free Code Camp 的主要核心和使命的一部分。 虽然我不想建议我管理的房间,并且我知道这会完全影响该房间的活动,但这些房间可能会退役到其他平台(如 FB),但需要注意的是他们将失去 A大量的流量 - 如果 Gitter 作为 FCC 平台变得不那么突出,他们无论如何都会这样做。
仅当您确定这些房间不直接为 FCC 项目做出贡献时,才应这样做。 否则,我建议您保留它们,直到您看到删除其他相关房间后 Gitter 活动会发生什么。
我同意昆西的观点。 如果有非常活跃的城市房间可以考虑保留(我知道克利夫兰,我来自哪里,自四月以来就没有了。)我确实认为将与其他房间重复的房间配对会让事情变得更容易。 像以前改过的旧帮助室。
现在,西班牙语/中文我们不碰它们。 中国人尤其是因为缺乏一个好的 FB 替代品。 我认为我们应该能够使用一系列技能组合来处理大约 15 个左右的房间。 正面、数据、背面、代码审查、配对、CodingJobs。 贡献者,核心。 我很确定应该添加其他房间,但这些是我最喜欢的房间。 一旦我们转向新课程(认证的每个部分都是它自己的认证可能保证有自己的房间)
也许作为一个远离编码的地方,可以远离话题。
@evaristoc感谢您的反馈。 我们可以将数据科学室分开,因为正如您指出的那样,它用于很多事情,并且活动和参与者非常健康。
我同意@CarlJKashnier 的观点,即我们应该拍摄 15 个总房间,这将有助于所有剩余的房间更加活跃。 我们以前曾多次清理过这些房间,距离上次清理已经有大约一年的时间了。
我不建议我们删除任何活动的帮助室——只删除不再使用的旧帮助室。 我们早就应该删除这些 - 它们造成的混乱超过了任何存档好处:
我建议我们立即删除以下房间:
对于特定于编程语言的房间,我认为我们应该@all提及它们并附上标准信息说明为什么我们认为论坛是讨论这些主题的更好场所(由于信息量很少),然后稍等几天看看人们的反应。
我认为应该@all通知课程开发、徒步旅行、LocalLeaders(过去一个月基本上不活跃)、CamperBot、NonprofitProjects(基本上不活跃)、LiveCoding 和 Translators,我们正在创建一个名为“贡献者”的新房间,并在 3 天内删除这些房间之后。
“贡献者”本质上是一个供 FCC 贡献者和“超级用户”(包括为非营利项目和 LetsMeet 风格的内部工具做出贡献的露营者)的房间。它将向所有人开放(CoreTeam 是我们唯一的专属房间)并且可以作为排序一群有兴趣让 Free Code Camp 变得更好的人。
建议? 预订?
同意。 有没有办法让我们联系 Gitter 并获取消息的副本以进行存档。
@raisedadead我认为所有这些房间仍然被谷歌索引
@BerkeleyTrue @raisedadead这些房间由 Google 存档,但在我们删除它们后,它们将不再显示在搜索结果中。 我创建了一个问题来协调完整数据集的下载和开放数据发布: https :
直到房间被删除,还可以在这些房间中添加欢迎消息,(可选)将所有人从房间中删除; 这样当有人加入时,它会显示欢迎信息。
这是用于添加欢迎消息的 gitter API 端点
METHOD: PUT
URI: /rooms/:roomId/meta/welcome-message
DATA: {"welcomeMessage":"# Welcome\n\nHi"}
我认为应该
@/all
通知课程开发、远足、LocalLeaders(过去一个月基本上不活跃)、CamperBot、NonprofitProjects(基本上不活跃)、LiveCoding 和 Translators,我们正在创建一个名为“贡献者”的新房间并删除3 天后这些房间。
@QuincyLarson我建议将项目房间(例如CamperBot房间)分开,因为它是一个不同的项目(_尽管是 FreeCodeCamp_ 的一部分)。
@abhisekp我只是好奇,如果这些项目室基本上处于非活动状态,为什么我们应该保留它们?
CamperBot 的房间非常不活跃 - 实际上每周一条消息。 我们的目标是将这些房间压缩到尽可能少的地方,以最大限度地提高整体活动量并最大限度地减少“大家好……[蟋蟀]”的影响。
我们可以在贡献者房间中轻松讨论在 FCC 整体改进的背景下对 camperbot 的更改。
@abhisekp感谢您找到我们可以命中的端点。 roomId 是房间的名字吗? 还是我们必须在单独的步骤中收集所有房间 ID 的列表?
@QuincyLarson :roomId
房间是546fd572db8155e6700d6eaf
可以通过按名字加入房间来获得,例如
METHOD: POST
URI: /rooms
DATA: {"uri": "FreeCodeCamp/FreeCodeCamp"}
这是一个两步过程。
:point_right: https://www.npmjs.com/package/node-gitter#promises -or-callbacks
@abhisekp很棒 - 谢谢你的澄清。
您是否有兴趣编写更新所有房间主题(我们计划保留的主题除外)的脚本? 这将为我们节省大量乏味的工作,我同意在我们下载他们的历史记录并准备删除它们的同时,将这些房间与这个主题分开几天会很棒。
@QuincyLarson当然......我会弄清楚并编写脚本。 :+1:
@abhisekp你有时间在这方面取得任何进展吗?
@QuincyLarson是的。 我已经取得了进展,并将尽快完成。
这几天我的健康状况不佳。 对不起! 对于延迟。
@abhisekp好的 - 太棒了! 我很高兴你还在研究这个。 不用担心延误。 我希望你能尽快感受到💯 :)
@QuincyLarson哪个房间做你不想贬低?
谢谢你给我这个机会。 在创建这个脚本时,我觉得需要一个速率限制器 api(_没有找到任何这样的存在_)。 所以我创建了一个速率限制器库 (https://rate-limiter-api.js.org) :smile: 用于管理 3rd 方 api 速率限制而没有任何麻烦。
脚本准备好了。 很抱歉耽搁了。
请向我提供以下信息
该房间处于非活动状态,仅用于存档目的。 加入一些活跃的房间 - 这是完整列表: https :
- 一条聊天消息
- 欢迎留言
- 要保存的房间列表(白名单)
- 不保存的房间列表(黑名单)(_可选_)
- 保存列表中不保存的房间列表
请不要弃用FreeCodeCamp/Git房间,因为 gitter (_weird_) 中没有 git 房间:stuck_out_tongue_winking_eye:
我一直在使用以下消息进行宣传,并且越来越多的人每天都来。
立即查看_all_您的Git
相关问题。
不要害羞:脸红:。 立即解决它们。 解决方案是_仅一步之遥_。
通过 Git Ninjas 提问并得到回答:panda_face:
:point_right: FreeCodeCamp/Git :flushed:
@abhisekp我看到了你的消息
我估计用你的脚本,下载一百万条消息需要大约 17 天,我怀疑我们的主聊天室有更多。 如果您的优化会显着加快速度,那太好了 - 请制作它们。
否则,我建议我们专注于让这个脚本准备好在数字海洋服务器上为许多不同的房间连续运行,将这些数据转换为特定于房间的 .csv 文件,我们可以将其作为开放数据集发布。
我们可以先关注我们计划删除的所有房间,然后开始在我们的主要房间(不会被删除)上运行它。
您可以将它们转储到本地目录中,我可以手动检索它们并稍后将它们放在 bittorrent 上。
@Berkeleytrue你怎么看这个计划?
最主要的是我们尽快删除这些“鬼城”房间。 感谢您为此付出的辛勤工作。
@BerkeleyTrue你有什么想法?
@QuincyLarson @abhisekp
我一直在与@alayek交谈,他也想为此制作一个脚本。 不知道他在这方面的进展。
也许@abhisekp想联系他?
@abhisekp @alayek你好,我也在关注这个。 现场讨论它可能会很有趣。 你愿意参加在线会议吗? (Skype、谷歌环聊、webex ...)
@abhisekp您设法下载了多少聊天室? 我渴望推进整合,但不想在此过程中丢失任何数据。 谢谢!
@QuincyLarson我还需要几天时间。 我一直在寻求有关最佳解决方案逻辑的帮助。 _我的考试正在进行中,所以无法集中精力。_
如果有人可以帮助优化逻辑,那就太好了。 (_具有与 gitter 断开连接并存储在数据库中的故障保护_)即
我正在尝试使用 PostgreSQL 为每个房间存储带有表格的消息。 (_使用 NoSQL 数据库,可能需要大量内存_)
我不知道所有东西在 HDD 中会占用多少空间。
PostgreSQL 支持导出为 csv。
一些事实:
beforeId
limit
(_max 100_)skip
(_max 5000_)// cc: @alayek @evaristoc你们能帮忙吗?
@abhisekp感谢您的更新,并感谢您分享迄今为止的进展。
祝你考试顺利。
@FreeCodeCamp/issue-moderators 有人有兴趣解决这个问题吗?
@abhisekp是的,祝考试好运!
我明白你想做什么。 看起来不错! 你用什么语言? 这是端点 API 吗? 好主意!!!
我预计下载此材料的流量不会很大,但偶尔会出现大量下载。 我预计数据库不会承受很大压力,因此可能不需要额外的负载处理。 尽管如此,我想应该考虑警告下载损坏的情况......
代码在哪里,@abhisekp? 我喜欢你的方法...
@evaristoc听起来,如果件事。 无论如何,我们计划将所有这些房间的内容作为开放数据发布。 你能开始存档过程吗?
@FreeCodeCamp/issue-moderators
我们将执行以下操作:
这是我们新的官方房间(我已经在我们的 wiki 上更新了
FreeCodeCamp我们的主要聊天室 - 闲逛,聊聊生活和学习
帮助从您的营员伙伴那里获得有关 HTML、CSS 和 jQuery 挑战的帮助
HelpJavaScript从您的营员伙伴
HelpFrontEnd从您的营员伙伴
HelpDataViz从您的营员伙伴
HelpBackEnd从您的营员伙伴
CodeReview就您的项目提供和接收来自其他营员的建设性反馈
YouCanDo学习编码很难 - 在这里分享您的感受并获得精神支持
休闲,你可以聊聊这里与其他营员的非编码利益
贡献者帮助我们改进我们的开源课程
DataScience帮助我们了解我们的演出和公共数据演出
我创建了一个名为“贡献者”的新房间,所有关于以任何方式(我们的开源存储库、YouTube、Medium 等)为 FCC 做出贡献的非核心团队讨论都将在那里进行。 这将促进更多的跨学科协作,让人们更好地了解人们在做什么,并引起轰动。
我告诉以下房间的人加入我们新的贡献者房间:
我正在寻找能够帮助我们完成以下工作的核心团队成员:
谁有兴趣帮助完成这个过程?
@QuincyLarson @evaristoc主题更改、聊天消息发布和欢迎消息已经使用脚本完成。 我可以立即启动它。
只是归档过程可能需要一点时间才能完成。
@abhisekp很棒 - 感谢您确认这一点。 是的,请这样做。
您是否已开始存档过程? 我们也许可以让不止一个人来做( @evaristoc可以做一半的房间,你可以做另一半?)这会加快存档过程。
@QuincyLarson很酷。 这是要保存的房间列表。 请确认,我可以开始了。 :+1:
FreeCodeCamp/FreeCodeCamp
FreeCodeCamp/Help
FreeCodeCamp/HelpJavaScript
FreeCodeCamp/HelpFrontEnd
FreeCodeCamp/HelpDataViz
FreeCodeCamp/HelpBackEnd
FreeCodeCamp/CodeReview
FreeCodeCamp/YouCanDoThis
FreeCodeCamp/Casual
FreeCodeCamp/Contributors
FreeCodeCamp/DataScience
FreeCodeCamp/CoreTeam
FreeCodeCamp/Espanol
FreeCodeCamp/chinese
_其他房间会有以下话题、聊天留言和欢迎留言_
这个房间将被关闭并存档。 请将有关此主题的讨论移至我们的论坛或官方 Free Code Camp 聊天室之一: http :
这个房间将被关闭并存档。
@/all 请将有关此主题的讨论移至我们的论坛或官方 Free Code Camp 聊天室之一: http :
这个房间将被关闭并存档。
请将有关此主题的讨论移至我们的论坛或官方 Free Code Camp 聊天室之一: http :
@abhisekp完美。 当您保存“已保存”时,您的意思是“未删除”,对吗?
@QuincyLarson是的。 不弃用。 :+1:
@abhisekp也请不要删除核心团队房间或修改其主题。
@QuincyLarson还有什么空间可以不弃用吗?
@abhisekp我不这么认为。 如果有人注意到某个房间收到了不应该收到的弃用通知,他们可以在此问题上提及它。
请保留编码工作聊天室。 即使我们不发表评论,我们中的很多人也会阅读它。 我已经看到工作机会弹出,我认为如果当时有人正在寻找编码员,他们在聊天而不是论坛中发帖会更容易、更快捷。 此外,动态对话更有趣。 谢谢您的考虑。
编码工作室在此线程中有许多帖子状态,并在那里张贴了弃用通知。
linux、ruby、python 以及可能letsPair 和 git 房间值得保存。 还有 GameDev 室。
虽然我同意一些国家特定的房间、题外话和其他根本没有帮助的房间被删除的决定,但我非常不同意删除特定语言的房间,尤其是那些仍在流行和流行的语言像长生不老药。
额外的房间有助于解决特殊性和像 /FreeCodeCamp/FreeCodeCamp 这样的一般房间过度拥挤的问题,我们可以让人们谈论这些房间里的具体事情。 我也喜欢letsPair 房间,也许问题不在于房间没有得到露营者的太多关注和交通方向。
创建贡献室是明智的,但只是有这么多房间被引导到那里,我不知道它会如何运作,但我真的希望它能做到。 我想要 Python、Elixir、Ruby 和 PHP 房间,因为根据 FCC 的愿景,你们想要为这些语言提供“东西”,菜单或地图上没有关于这些的信息,只是一个人们现在可能不记得的中等帖子。
git 房间也可以是一个看门人。
而且,除此之外,关于这个:
如果有人注意到某个房间收到了不应该收到的弃用通知,他们可以在此问题上提及它。
我必须补充一点,也许将这个(隐藏得很深的)问题链接添加到房间中的通知标题会很好,因为,你知道,让人们真的
在这里提到这个问题
现在,文本只是警告人们他们正在使用和每天检查的房间将关闭,没有任何事先警告,也没有向使用它的人询问任何意见。 只是一句话。 无论如何,它将被关闭,您必须使用建议的劣等替代方案(是的:过度拥挤和分散的渠道或子论坛是特定聊天室的劣等替代方案)。
你好。 我在 NYC FCC 小组。 我们有一个活跃的团体,随着位于皇后区的 FCC Coffee N Codes 的推出,该团体越来越受到关注。
正式要求 /NewYorkCity 不被弃用。
编辑:懒惰的链接。
@AryanJ-NYC 感谢您指出 gitter.im/freecodecamp/NewYorkCity。 这是一个以本地为中心的聊天室蓬勃发展的特例。 如果此房间保持活动状态,我们可以将其保留为不公开。 我正在房间里发布更新。
@coffeebeanzz您说得对 - 将弃用通知发送给 CodingJobs 是错误的。 我已将其重新添加到正式的房间列表中,并在房间内发送了一条消息,说明它不会被存档。
我已经发布了此过程的详细解释并将其固定在论坛顶部: http :
请让我们保留 Let's Pair 房间。 许多露营者通过在这个房间见面来分享和追赶彼此以完成他们的挑战。
FCC 的概念之一不是与其他人结对以增强我们的编码学习和体验吗?
我关注的仅有的两个房间是 Front End 和 Let's Pair。
@KoniKodes在查看 LetsPair 并与那里的几位露营者交谈后,我同意我们应该将其列为正式房间。
你是我的主要英雄之一。 非常感谢。
来自:昆西拉森 [mailto:[email protected]]
发送:2016 年 9 月 17 日星期六下午 3:39
至:FreeCodeCamp/FreeCodeCamp
抄送:KoniKodes; 提到
主题:回复:[FreeCodeCamp/FreeCodeCamp] 弃用 Gitter 房间,下载所有数据 (#8418)
@KoniKodes https://github.com/KoniKodes在查看 LetsPair 并与那里的几位露营者交谈后,我同意我们应该将其列为官方房间。
—
你收到这个是因为你被提到了。
直接回复本邮件,在 GitHub 上查看https://github.com/FreeCodeCamp/FreeCodeCamp/issues/8418#issuecomment -247812317 ,或者将线程静音https://github.com/notifications/unsubscribe-auth/ARjWiUauw4_o2DR5nIyYazvVm5KgerZv2 . https://github.com/notifications/beacon/ARjWicsQahixEmA4fdn-_d98WTruUffZks5qrGv_gaJpZM4IWBHE.gif
嗨@abhisekp你下载这些有什么进展吗?
@QuincyLarson我还在研究这个。 需要多一点时间。
@abhisekp好的 - 感谢您确认这仍在进行中。 不着急😃
@abhisekp让我知道我可以提供什么帮助。 另请阅读我上面的消息:
https://github.com/FreeCodeCamp/FreeCodeCamp/issues/8418#issuecomment -247571215
@evaristoc :嗨! 很高兴读到你 :) 我很好奇你处理这个问题的方式。 无需共享令牌,请您制作一个回购或其他任何东西。 有没有办法在运行脚本之前弄清楚房间中有多少数据? 然后我们可以估计所需的时间。 你下载的是1.3G吗? 使用 NodeJS 并将数据写入 JSON 文件,其中 2 个房间给了我以下结果:
@evaristoc如果您还可以拉下所有房间并将它们保存为可以作为开放数据(CSV?)发布的格式,这将非常有帮助。 如果您可以在不到一天的时间内拉出整个主房间,那意味着您应该能够很快拉出大部分房间。
@ladybugtju一旦我们将所有聊天室存档并安全备份,我们就可以开始删除聊天室。 我们没有删除的唯一房间是:
FreeCodeCamp/FreeCodeCamp
FreeCodeCamp/帮助
FreeCodeCamp/HelpJavaScript
FreeCodeCamp/HelpFrontEnd
FreeCodeCamp/HelpDataViz
FreeCodeCamp/HelpBackEnd
FreeCodeCamp/CodeReview
FreeCodeCamp/YouCanDoThis
FreeCodeCamp/休闲
FreeCodeCamp/贡献者
FreeCodeCamp/数据科学
FreeCodeCamp/核心团队
FreeCodeCamp/西班牙语
FreeCodeCamp/中文
FreeCodeCamp/结对编程女性
FreeCodeCamp/纽约市
FreeCodeCamp/letspair
FreeCodeCamp/codingjobs
@QuincyLarson :感谢您的名单。 还有一些其他房间有很多订阅者并且似乎很活跃。 我想我会反过来做,只下载要保留的房间_或其中一些。 这是 Room_Ids 的列表:(可能有用)
https://docs.google.com/spreadsheets/d/1HSRL-HTOREYF86mNDczNp7XNA5Tuo4TWP4AiMYyZDU8/edit?usp=sharing
@ladybugtju尽管这些房间有些活跃(每周有几条消息),但我们还是决定关闭它们。 下载我们保留的房间很有帮助,但我们的目标是确保我们已备份所有要删除的房间以供存档。
@QuincyLarson :感谢您的及时回复。 我也可以提供帮助,但由于 abhisekp 已经加入了所有房间(他应该拥有所有 ID),我正在考虑在本周末下载核心房间以及其他一些房间。 可能需要大约 5 小时。 关键是要开源数据,让人们也分析它,对吧? 我将能够为一些相关房间提供 JSON 格式
我还请您注意以下可能值得保留的房间:
25 FreeCodeCamp/HelpBonfires 55b516800fc9f982beab0950 4141
28 FreeCodeCamp/HelpZiplines 55b522300fc9f982beab0a40 2203
29 FreeCodeCamp/CamperPracticeProjects 54ef614115522ed4b3dc863b 1692
31 FreeCodeCamp/课程开发 54d96d6915522ed4b3dbd2ce 846
@ladybugtju是的 - 这真的很有帮助。 我们也可以将这些房间的数据包含在开放数据集中。
关于你提到的其他房间:
@QuincyLarson @evaristoc :嗨! 希望你周末过得愉快。 我今天早上运行脚本,发现当数据超过1G时,节点存在内存分配问题。 我需要再深入研究一下,但这里有最新的更新:
代码在 4H30mn 后崩溃 - 内存中的数据:1.4G(可能是房间数据值,但我怀疑它是崩溃级别,因为我发现类似的脚本在同一点崩溃)
这是控制台输出:
<--- 最后几次 GC --->
15953303 毫秒:标记扫描 1372.8 (1435.0) -> 1363.8 (1427.5) MB,1203.0 / 0 毫秒 [分配失败] [旧空间中的 GC 请求]。
15954582 毫秒:标记扫描 1363.8 (1427.5) -> 1363.8 (1428.5) MB,1278.9 / 0 毫秒 [分配失败] [请求旧空间中的 GC]。
15955886 毫秒:标记扫描 1363.8 (1428.5) -> 1363.8 (1427.5) MB,1304.2 / 0 毫秒 [最后手段 gc]。
15957195 毫秒:标记扫描 1363.8 (1427.5) -> 1363.5 (1427.5) MB,1309.3 / 0 毫秒 [最后手段 gc]。
<--- JS 堆栈跟踪 --->
==== JS 堆栈跟踪 ==========================================
安全上下文:0x3f8620ec9fa9
1:_callback [/Users/MacBookPro/Desktop/TEST apps/FCC_challenges/Gitter/GitterApiV2/gitter-demo-app/fccGitterData.js:37] [pc=0x7c8872149cb](this=0x26b775e241a1 ,8420xe
FAbort 陷阱:6
这周我很忙,但下一个会有更多的时间来工作。
@evaristoc我想知道您是否没有遇到同样的问题,或者您有什么建议
@QuincyLarson :下载较小的房间没有问题,但主房间很重。 最好与 gitter 人员核实并询问那里有多少数据。 我给他们发了一封电子邮件,但仍在等待中
@ladybugtju好的 - 听起来不错。 谢谢你的帮助。 然后继续下载小房间。 我们要删除的大部分房间都比较小。
@ladybugtju @abhisekp @evaristoc你有免费代码营组织下所有房间的清单吗? 如果是这样,您能否在我们备份它们时创建已备份的所有房间的要点? 这样我们就可以看到我们在这方面取得了多少进展。
感谢您的辛勤工作。 这是每天与露营者交谈时都会出现的问题。 一旦我们整合了这些房间,聊天将变得更加有用(和可探索)。
存档的房间标有
并且删除的房间都标有删除的文字标记
@abhisekp完美。 谢谢!
@abhisekp我更新了您的列表,以便我们不打算删除的所有房间都在底部。
问题:有没有办法从已弃用的房间中保留必要的数据,但仍将它们从此页面中删除? https://gitter.im/orgs/FreeCodeCamp/rooms
WaitButWhy:因为在追求一个活跃和相关的房间时,学生很容易被误导、分心和被核心房间吓倒,这些房间不方便显示在探索 FCC 链接的第一页上。 合并肯定有助于解决这个问题💯。 我相信,如果我们能轻松找到像 _Git_ 这样的房间,我们会看到更多与 Freecodecamp 使命相关的房间的积极参与。
https://gitter.im/FreeCodeCamp/Git
此外,我认为 _Git_ 是必要房间的完美例子。 在 Gitter 上没有活跃的房间,以至于有一个专门用于 Git 或 Github 的社区,我被告知这两者对于成为开发人员都是必不可少的。 我认为我们可以通过不仅包括 git 还包括 _command line_、_editors_、_GUI 客户端,其中有很多_,当然还有 _Github 相关的所有内容_可以使房间更具包容性,以增加社区参与度👍
@ladybugtju抱歉回复晚了:
是的,使用 node 时可能会出现问题,但请检查:你是异步的吗? 也许分块写入并尽量不将数据保存在内存中? 我一直在使用没有那个限制的python; 我的问题是更多的内存,但我也可以制作块。
主房间未列出供下载。
@evaristoc :您好,感谢您的留言,抱歉蜗牛的回复,我最近很忙。 将在 1/2 周内有更多时间。 上次看这个的时候发现是node和python都必须面对的内存问题。 似乎与内核有关,即使物理RAM更大,单个进程一次也不能使用超过2GB。 这可以使用 /3gb boot.ini 增加到 3GB。 尝试可能很有趣(我附上了我发现这个帖子的地方)。
Python
http://stackoverflow.com/questions/4285185/upper-memory-limit
节点
https://www.youtube.com/watch?v=NLtL-EEclRc
这个公寓,我下载了一些房间,但也许更好地协调? 我开始查看@abhisekp发布的列表,但发现发布的消息和 Json 文件之间存在差异。 你在哪儿? 我记得房间号很大,有些没有消息或几乎没有消息。 还请分享您的 Python 方法。 我现在也知道一些 python :)
@ladybugtju嗨! 感谢您调查问题并提供链接。
我已在此处将弃用脚本的源代码上传到 BitBucket https://bitbucket.org/abhisekp/gitter-archive/src
这存储在 postgresql db 中,而不是直接存储在 csv 文件中,稍后可以将其导出到 csv。
它会下载消息,但会停止大约 30k 条消息。 但是重新开始,它从停止的地方开始。
由于一些技术困难,我无法解决下载时遇到的一些问题。
嗨@abhisekp :很抱歉回复蜗牛,忙碌的日子。 我会在 14 号之后再次查看所有这些,但我想我实际上已经下载了 10 个左右的房间并列出了一个简短的列表。 我们可以关闭几个没有用的房间,然后下载其他几个小房间。 让我们分工? 我们可以稍后解决其他问题。 您下载了多少个房间?您的偏好是什么?
@ladybugtju感谢您的更新。 感谢您这样做。
你能分享一下你已经下载的房间列表吗?
由于 PC 的技术问题和不稳定的连接,我无法继续。
@ladybugtju我建议我们立即关闭所有房间,一旦您下载了所有房间的数据并且我们已经备份了它们。
最简单的方法是为每个房间创建单独的文件并将它们推送到我创建的这个 repo: https :
我已授予您和整个审核团队(包括 @abhisekp)作为成员的资格。
什么格式最适合这些? CSV 更紧凑,允许在电子表格中浏览数据。
当房间被推送时,可以在上面的清单中检查它们。
@ladybugtju @abhisekp在这方面有任何进展吗? 如果我能帮上忙,请告诉我。 我渴望合并这些房间。
@QuincyLarson我已经完全下载了FreeCodeCamp/FreeCodeCamp
主房间,直到17-12-2016 3:39:24 PM GMT 。
总未压缩大小:588 MB(制表符分隔格式.tsv
)
使用 7z 压缩大小:95 MB(将使用git-lfs上传到repo )
room_id | room_uri | sent_at | from_userid | from_username | message_id | 文本
:----:|:----:|:----:|:----:|:----:|:----:|----:
546fd572db8155e6700d6eaf | FreeCodeCamp/FreeCodeCamp | 2014-11-22T00:26:21.469Z | 546fd823db8155e6700d6eb4 | 瑞巴 | 546fd82da07c098d4401b480 | 你好。
546fd572db8155e6700d6eaf | FreeCodeCamp/FreeCodeCamp | 2014-11-22T00:15:04.643Z | | | 546fd58872a00ba87914fcfe | @FreeCodeCamp第一人称
注意:原始消息中的
from_userid
和from_username
字段为空。
这是 FreeCodeCamp 房间里的第一条消息 :smiley:
笔记。 我监控了整个下载过程,下载消息时绝对没有错误。
我使用http://papertrailapp.com进行日志记录。
//抄送: @evaristoc
git-lfs 不能使用,因为它是收费的。 而且 github 不是上传大文件的正确地方。
https://github.com/ckolivas/lrzip提供最佳压缩。 我能够将588 MB
文件压缩到只有75 MB
。 然后解压。 (均使用 C9 即 512 MB 内存限制)
@abhisekp 太棒了! 我没有意识到 Git-LFS 需要花钱。 我们不能将这些文件推送到仓库吗? FreeCodeCamp/FreeCodeCamp 是一个数量级最大的 Gitter 房间,因此在这种压缩级别下,其他房间应该没有太大问题。
我们可以将其转储到 Amazon S3 吗? GitHub 显然不是数据存储的正确位置。 它带有免费的 5GB 存储空间,数据检索每 GB 费用为 0.01 美元。
我想我们已经有这样的实例了吗?
@raisedadead是的 - 我可以将它们放入我们的 AWS S3 帐户中进行托管。 一旦您为我们正在存档的所有房间准备好文件,让我们接听电话并弄清楚如何将它们从您的计算机获取到我们的 S3 实例。
@QuincyLarson , @abhisekp目前拥有数据。 所以也许他只能指导最好的。
只要您可以(也许在伯克利的帮助下)为他创建具有正确范围的凭据,上传就应该非常直接
但是,如果我能以任何方式提供帮助,请告诉我。
@raisedadead谢谢你的主意! 我专门为@abhisekp创建了一个 S3 密钥并将其发送给他。
你好呀
很高兴看到这样的进展 :) @abhisekp ,下载的房间在我之前分享的同一个链接上: https : //docs.google.com/spreadsheets/d/1HSRL-HTOREYF86mNDczNp7XNA5Tuo4TWP4AiMYyZDU8/edit#gid =0
不过,它可以追溯到 10 月,因此重新调整数据可能更好。 我实际上选择了重要且活跃的房间,所以肯定会有很多新东西。 您是自动下载所有房间还是必须单独下载? 如果您需要帮助,请告诉我。 干杯
PS:这里是下载房间的链接: https :
10 月 21 日 12 个房间。这只是一个 weTransfer 但你可以使用 Github、AWS 或其他
归档 gitter 社区无忧 :smiley:
CTRL + C
结束进程)并且在开始时,它从它停止的地方恢复(根据自动生成的文件gitterarchive-settings.json
)。# install globally
$ npm i -g gitter-archive-cli
创建一个目录,用于保存 gitter 社区档案。
按照下面的示例,在该目录中创建一个.env
文件和.gitterarchiverc.json
。
注意:
noArchiveList
优先于archiveList
。
现在只需使用gitter-archive
命令启动存档过程。 :微笑:
.env
# Gitter Tokens
GITTER_TOKEN_username1=
GITTER_TOKEN_username2=
GITTER_TOKEN_username3=
.gitterarchiverc.json
{
"rooms": {
"noArchiveList": [
"FreeCodeCamp/HelpJavaScript",
"FreeCodeCamp/FreeCodeCamp",
"FreeCodeCamp/Help",
"FreeCodeCamp/HelpFrontend",
"FreeCodeCamp/HelpBackend",
"FreeCodeCamp/[a-m]*"
],
"archiveList": [
"FreeCodeCamp/*"
]
},
"groups": {
"enabled": [{
"uri": "FreeCodeCamp",
"id": "57542cf4c43b8c6019778297"
}],
"disabled": []
}
}
$ gitter-archive
如果它突然停止,那么只需再次运行上面的命令,它就会从停止的地方自动恢复。 :white_check_mark:
如果您看到错误响应 429 状态,请等待一两分钟,不要结束该过程。
旁注:它在C9.io 中无缝
// 抄送: @evaristoc @ladybugtju
@abhisekp 太棒了! 如果这行得通,您能否继续将其设置为不间断运行,直到我们所有的房间都备份完毕? 然后我们可以将其压缩并将其推送到 S3。
@abhisekp让魔法发生:) 干杯
@QuincyLarson @ladybugtju谢谢。 魔法几乎完成了 :smirk:
:point_right: https://github.com/FreeCodeCamp/gitter-history
Github 对文件大小有严格的 100 MB 限制,但在 50 MB 时发出警告。 我能够推送一个 53 MB 的文件( FreeCodeCamp/HelpFrontend
房间存档)。
— https://help.github.com/articles/what-is-my-disk-quota/
唯一剩下的房间是
FreeCodeCamp/Help
( messageCount: 1368452
)(291 MB 未压缩)FreeCodeCamp/HelpJavaScript
FreeCodeCamp/FreeCodeCamp
这些是最大的房间。
更新
使用zip
以最大压缩级别9
归档后推FreeCodeCamp/Help
空间。
文件大小:62 MB(压缩)
@abhisekp 了不起的工作。 那么既然这些房间处于版本控制中,您认为我们可以安全地开始删除这些房间吗?
至于较大的房间,我们可能希望按日期将它们分成单独的文件。 例如:FreeCodeCamp/FreeCodeCamp 2015 年 8 月 1 日 - 2015 年 11 月 31 日
这将使我们更容易继续向他们推送更新的档案。
这将是一个巨大的公共数据集,我想很多人都会对它感兴趣。 一旦它准备好,我们就可以在 Kaggle 上发布它:)
@abhisekp这个过程进展如何? 您是否设法对我们的 Gitter 房间进行了完整归档? 我们可以开始关闭我们现在不打算保留的房间吗?
我们的计划是:
一旦所有这些消息都在https://github.com/FreeCodeCamp/gitter-history 存储库中,我将检查并删除除我们官方房间列表中的房间之外的所有房间。 所有这些房间都已经有弃用消息,无论如何都没有被使用。
露营者仍然可以创建自己的非官方 Gitter 房间,但 freeCodeCamp 的聊天室结构将简洁明了,对于去哪个房间的歧义最小。
然后我们将使用https://gitter.im/FreeCodeCamp/home作为我们聊天室的主要入口。
抱歉@QuincyLarson问为什么是 FreeCodeCamp/FreeCodeCamp?
@evaristoc听起来答案是
...freeCodeCamp 的聊天室结构将简洁明了,对于去哪个房间的歧义最小。 - https://github.com/freeCodeCamp/freeCodeCamp/issues/8418#issuecomment -282459257
一个名为freeCodeCamp
的房间本身并不能真正描述房间的功能。
@QuincyLarson @erictleung对于我计划做的一个小项目,我从主房间下载了几乎所有消息。 数据是昨天的。
这是大约 2.5Gb 没有压缩的数据(如果我下载的数据是正确的)。 这是需要添加到回购中的东西吗?
@erictleung好点,但我知道这些是官方房间的列表。 Freecodecamp 房间还在:
https://github.com/freeCodeCamp/freeCodeCamp/issues/8418#issuecomment -247755458
这是我不知道的列表中的更改吗?
@erictleung无法重命名 Gitter 房间。 否则我们确实会将该聊天室重命名为“一般”或“休闲”。
@evaristoc是的 - 那太棒了。 如果您拉取所有 freecodecamp/freecodecamp,请务必将其添加到https://github.com/FreeCodeCamp/gitter-history
好的 - 所有被弃用的房间后来都被备份了。 我最近没有收到@abhisekp 的任何
预定存档的新房间:
目前正在探索@abhisekp在启动数据下载过程之前进行归档的方法:
https://github.com/freeCodeCamp/freeCodeCamp/issues/8418#issuecomment -238083019
https://github.com/freeCodeCamp/freeCodeCamp/issues/8418#issuecomment -269025399
https://github.com/freeCodeCamp/freeCodeCamp/issues/8418#issuecomment -258058263
@昆西拉森:
我试图使用@abhisekp制作的很棒的包: https : //www.npmjs.com/package/gitter-archive-cli但不幸的是它在我的电脑上不起作用。 它给出了一个我发现很难调试的404 error
。
我可能会在 Python 上工作。 我当前的代码似乎已经过时了。 显然我也受到459 error
的速率限制的影响 - 以前没有发生过,我设法下载
2017 年 3 月使用更简单的代码超过限制的消息。
如果可行,我将提供我的 Python 代码。 希望这将有助于找到一个标准代码来处理未来的聊天室归档。
@ladybugtju 的另一个更简单的选项:
https://github.com/ladybugtju/ffcGitterData/blob/master/fccGitterData.js
这是@abhisekp之前的一条消息,保留在此处作为参考: https :
@evaristoc请继续在上面链接的新线程上。
最有用的评论
请保留编码工作聊天室。 即使我们不发表评论,我们中的很多人也会阅读它。 我已经看到工作机会弹出,我认为如果当时有人正在寻找编码员,他们在聊天而不是论坛中发帖会更容易、更快捷。 此外,动态对话更有趣。 谢谢您的考虑。