{"payload":{"header_redesign_enabled":false,"results":[{"id":"653477436","archived":false,"color":"#3572A5","followers":74,"has_funding_file":false,"hl_name":"xrsrke/pipegoose","hl_trunc_description":"Large scale 4D parallelism pre-training for 🤗 transformers in Mixture of Experts *(still work in progress)*","language":"Python","mirror":false,"owned_by_organization":false,"public":true,"repo":{"repository":{"id":653477436,"name":"pipegoose","owner_id":22252984,"owner_login":"xrsrke","updated_at":"2023-12-14T06:20:37.595Z","has_issues":true}},"sponsorable":false,"topics":["transformers","moe","data-parallelism","distributed-optimizers","model-parallelism","megatron","mixture-of-experts","pipeline-parallelism","huggingface-transformers","megatron-lm","tensor-parallelism","large-scale-language-modeling","3d-parallelism","zero-1","sequence-parallelism"],"type":"Public","help_wanted_issues_count":10,"good_first_issue_issues_count":7,"starred_by_current_user":false}],"type":"repositories","page":1,"page_count":1,"elapsed_millis":83,"errors":[],"result_count":1,"facets":[],"protected_org_logins":[],"topics":null,"query_id":"","logged_in":false,"sign_up_path":"/signup?source=code_search_results","sign_in_path":"/login?return_to=https%3A%2F%2Fgithub.com%2Fsearch%3Fq%3Drepo%253Axrsrke%252Fpipegoose%2B%2Blanguage%253APython","metadata":null,"csrf_tokens":{"/xrsrke/pipegoose/star":{"post":"BFHpkodXOiRDE8240nJERlulzv8wFKZt0Sswr5wjGqruVO0eSV3nFVC0zgMB0EX68e42uvjDQmEEquqHh15DnA"},"/xrsrke/pipegoose/unstar":{"post":"iiF4nM9N6DvYSiZ6IZXFdjo-6TAY091J6YhvWydHu8XblGKu4y34CeLYLh9yBXd-JME4hIOjdDMVfbtmry8DJQ"},"/sponsors/batch_deferred_sponsor_buttons":{"post":"NhkvfFcsvCPyuu-whFaJB0RhgPjYpmjCzAdh3xfgzdQhlSfic_BS_3AsnoVkGNy_xlCRzZ8gfW8wH35EvMVYyw"}}},"title":"Repository search results"}