CUDA RentSense kNN

Небольшой учебный проект по CUDA: kNN-регрессия для оценки аренды по табличным признакам.

В проекте есть три режима:

cpu — последовательный baseline на C++
naive — CUDA kernel с расчётом попарных расстояний из global memory
optimized — CUDA kernel с tiled shared memory

Структура

cuda-rentsense-knn/
├─ CMakeLists.txt
├─ include/
├─ src/
├─ data/
└─ scripts/

Сборка

cmake -S . -B build -DCMAKE_BUILD_TYPE=Release
cmake --build build -j

Если CUDA_ARCHITECTURES native не подходит для вашей карты, задайте архитектуру вручную в CMakeLists.txt.

Быстрый запуск

На синтетических данных:

./build/cuda_rentsense_knn --mode all --data synthetic --N 10000 --Q 512 --D 32 --k 5

С записью результатов в CSV:

./build/cuda_rentsense_knn \
  --mode all \
  --data synthetic \
  --N 20000 \
  --Q 1024 \
  --D 32 \
  --k 5 \
  --csv results/benchmark.csv

Подготовка собственных данных

Скрипт data/prepare_dataset.py читает CSV, оставляет числовые признаки, делает split train/query, нормализацию и сохраняет бинарные файлы.

Пример:

python3 data/prepare_dataset.py \
  --csv your_data.csv \
  --target price \
  --out_dir data/processed

После этого можно запускать бинарный режим:

./build/cuda_rentsense_knn \
  --mode all \
  --data binary \
  --train_features data/processed/X_train.bin \
  --train_labels data/processed/y_train.bin \
  --query_features data/processed/X_query.bin \
  --query_labels data/processed/y_query.bin

Профилирование

Nsight Compute:

bash scripts/profile_ncu.sh

Nsight Systems:

bash scripts/profile_nsys.sh

Что измеряется

total_ms
h2d_ms
kernel_ms
d2h_ms
post_ms
rmse

Идея оптимизации

Основная вычислительная часть — матрица попарных расстояний между query и train объектами. Эта операция естественно распараллеливается. В optimized-версии часть признаков подгружается в shared memory, чтобы уменьшить число чтений из global memory.

Name		Name	Last commit message	Last commit date
Latest commit History 9 Commits
data		data
include		include
scripts		scripts
src		src
.gitignore		.gitignore
CMakeLists.txt		CMakeLists.txt
LICENSE		LICENSE
README.md		README.md

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

CUDA RentSense kNN

Структура

Сборка

Быстрый запуск

Подготовка собственных данных

Профилирование

Что измеряется

Идея оптимизации

About

Uh oh!

Releases

Packages

Uh oh!

Contributors

Uh oh!

Languages

Folders and files

Latest commit

History

Repository files navigation

CUDA RentSense kNN

Структура

Сборка

Быстрый запуск

Подготовка собственных данных

Профилирование

Что измеряется

Идея оптимизации

About

Topics

Resources

License

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Uh oh!

Contributors

Uh oh!

Languages

Packages