Βιβλιοθήκες γραμμένες σε Cuda

instant-ngp

Στιγμιαία πρωτόγονα νευρωνικά γραφικά: αστραπιαία NeRF και πολλά άλλα.
  • 13.4k
  • GNU General Public License v3.0

deep-high-resolution-net.pytorch

Το έργο είναι μια επίσημη υλοποίηση του εγγράφου μας CVPR2019 "Deep High-Resolution Representation Learning for Human Pose Estimation".
  • 4.1k
  • MIT

cub

Συνεταιριστικά πρωτόγονα για CUDA C++. (από NVIDIA).
  • 1.5k
  • BSD 3-clause "New" or "Revised"

cugraph

cuGraph - Βιβλιοθήκη RAPIDS Graph Analytics.
  • 1.3k
  • Apache License 2.0

blocksparse

Αποτελεσματικοί πυρήνες GPU για πολλαπλασιασμό και συνέλιξη μητρών με αραιό μπλοκ.
  • 948
  • MIT

k2

Αλγόριθμοι FSA/FST, διαφοροποιήσιμοι, με συμβατότητα PyTorch..
  • 927
  • Apache License 2.0

nv-wavenet

Εφαρμογή αναφοράς αυτοπαλινδρομικής συμπερασματικής κυματοειδούς σε πραγματικό χρόνο.
  • 700
  • BSD 3-clause "New" or "Revised"

nvParse

Γρήγορος αναλυτής CSV βασισμένος σε gpu.
  • 550
  • Apache License 2.0

instant-ngp-Windows

Στιγμιαία πρωτόγονα νευρωνικά γραφικά: αστραπιαία NeRF και πολλά άλλα.
  • 458
  • GNU General Public License v3.0

nccl-tests

Δοκιμές NCCL.
  • 436
  • BSD 3-clause "New" or "Revised"

MegBA

MegBA: Μια κατανεμημένη βιβλιοθήκη βασισμένη σε GPU για προσαρμογή δέσμης μεγάλης κλίμακας.
  • 368
  • Apache License 2.0

raft

Το RAFT περιέχει βασικούς ευρέως χρησιμοποιούμενους αλγόριθμους και πρωτόγονους για την επιστήμη δεδομένων, τη γραφική παράσταση και τη μηχανική μάθηση. (από rapidsai).
  • 278
  • Apache License 2.0

dietgpu

Εφαρμογή GPU ενός γρήγορου γενικευμένου κωδικοποιητή και αποκωδικοποιητή εντροπίας ANS (ασύμμετρο αριθμητικό σύστημα), με επεκτάσεις για συμπίεση χωρίς απώλειες αριθμητικών και άλλων τύπων δεδομένων σε εφαρμογές HPC/ML.
  • 247
  • MIT

TorchPQ

Κατά προσέγγιση αναζήτηση πλησιέστερου γείτονα με κβαντοποίηση προϊόντων σε GPU σε pytorch και cuda.
  • 173
  • MIT

Lantern

  • 163
  • BSD 3-clause "New" or "Revised"

RWKV-CUDA

Η έκδοση CUDA του μοντέλου γλώσσας RWKV (https://github.com/BlinkDL/RWKV-LM).
  • 113

cuhnsw

Υλοποίηση CUDA του αλγορίθμου Hierarchical Navigable Small World Graph.
  • 88
  • Apache License 2.0

CUB

ΑΥΤΟ ΤΟ ΑΠΟΘΗΚΕΥΤΗΡΙΟ ΕΧΕΙ ΜΕΤΑΦΕΡΘΕΙ ΣΤΟ github.com/nvidia/cub, ΤΟ ΟΠΟΙΟ ΑΝΤΙΚΡΕΠΕΤΑΙ ΑΥΤΟΜΑΤΑ ΕΔΩ..
  • 71
  • BSD 3-clause "New" or "Revised"

array-language-comparisons

Σύγκριση γλωσσών και βιβλιοθηκών συστοιχιών: APL, J, BQN, Q, Julia, R, NumPy, Nial, Futhark, SaC & ArrayFire..
  • 60
  • MIT

mish-cuda

Λειτουργία ενεργοποίησης Mish για PyTorch (από JunnYu).
  • 48
  • MIT

rocm-examples

  • 39
  • MIT

xgboost-node

Εκτελέστε το μοντέλο XGBoost και κάντε προβλέψεις στο Node.js.
  • 33
  • GNU General Public License v3.0

CUDA-Guide

CUDA Guide.
  • 29

kobra

Μηχανή παιχνιδιών με ερευνητικό προσανατολισμό που εξερευνά τις πιο σύγχρονες τεχνικές απόδοσης (από vedavamadathil).
  • 21

CryptoGPU

Ανάλυση τιμών κρυπτονομισμάτων.
  • 16

LSQR-CUDA

Αυτή είναι μια υλοποίηση LSQR-CUDA που γράφτηκε από τον Lawrence Ayers υπό την επίβλεψη του Stefan Guthe του ινστιτούτου GRIS στο Technische Universität Darmstadt. Η βιβλιοθήκη LSQR δημιουργήθηκε από τους Chris Paige και Michael Saunders..
  • 11
  • MIT

SBNN

Singular Binarized Neural Network που βασίζεται σε λειτουργίες Bit GPU (δείτε την εργασία μας SC-19).
  • 10
  • GNU General Public License v3.0

GCGT

Πηγαίος κώδικας για το χαρτί: Συμπιεσμένη διέλευση γραφήματος που βασίζεται σε GPU.
  • 7
  • MIT

FirstCollisionTimestepRarefiedGasSimulator

Αυτός ο προσομοιωτής υπολογίζει όλες τις πιθανές διασταυρώσεις για ένα πολύ μικρό χρονικό βήμα για ένα μοντέλο σωματιδίων.
  • 2

DOKSparse

αραιοί τανυστές DOK σε GPU, pytorch.
  • 1
  • MIT