diff --git a/whisper.cpp b/whisper.cpp
index d7bbeb4d..d16492cd 100644
--- a/whisper.cpp
+++ b/whisper.cpp
@@ -651,12 +651,11 @@ static void whisper_allocr_graph_init(struct whisper_allocr & allocr, ggml_backe
     auto & meta   = allocr.meta;
     auto & buffer = allocr.buffer;
 
-    const int tensor_alignment = ggml_backend_get_alignment(backend);
-    alloc = ggml_allocr_new_measure(tensor_alignment);
+    alloc = ggml_allocr_new_measure_from_backend(backend);
 
     meta.resize(ggml_tensor_overhead()*WHISPER_MAX_NODES + ggml_graph_overhead());
 
-    const size_t alloc_size = ggml_allocr_alloc_graph(alloc, get_graph()) + tensor_alignment;
+    const size_t alloc_size = ggml_allocr_alloc_graph(alloc, get_graph());
 
     ggml_allocr_free(alloc);
 
@@ -1299,7 +1298,7 @@ static bool whisper_model_load(struct whisper_model_loader * loader, whisper_con
 
         // initialize the backends
 #ifdef GGML_USE_CUBLAS
-        if (wctx.params.use_gpu > 0) {
+        if (wctx.params.use_gpu) {
             WHISPER_LOG_INFO("%s: using CUDA backend\n", __func__);
             backend_gpu = ggml_backend_cuda_init();
             if (!backend_gpu) {