opendatahub-io · israel-hdez · Sep 2, 2024 · dtrifiro · Sep 6, 2024
diff --git a/Dockerfile.ubi b/Dockerfile.ubi
@@ -196,9 +196,11 @@ RUN umask 002 \
     && chmod g+rwx $HOME /usr/src /workspace
 
 COPY LICENSE /licenses/vllm.md
+COPY --chown=2000:0 --chmod=554 extras/wait-modelcar.sh .
 
 USER 2000
-ENTRYPOINT ["python3", "-m", "vllm.entrypoints.openai.api_server"]
+ENTRYPOINT ["/workspace/wait-modelcar.sh"]
+CMD ["python3", "-m", "vllm.entrypoints.openai.api_server"]
 
 
 FROM vllm-openai as vllm-grpc-adapter
@@ -217,4 +219,4 @@ ENV GRPC_PORT=8033 \
     DISABLE_LOGPROBS_DURING_SPEC_DECODING=false
 
 USER 2000
-ENTRYPOINT ["python3", "-m", "vllm_tgis_adapter", "--uvicorn-log-level=warning"]
+CMD ["python3", "-m", "vllm_tgis_adapter", "--uvicorn-log-level=warning"]
diff --git a/extras/wait-modelcar.sh b/extras/wait-modelcar.sh
@@ -0,0 +1,14 @@
+#!/bin/bash
+
+if [ "${MODEL_INIT_MODE}" = "async" ] ; then
+  echo "Waiting for model files (modelcar) to be present..."
+  until test -e /mnt/models; do
+    sleep 1
+  done
+
+  echo "Model files are now available."
+fi
+
+echo "Starting model server..."
+eval $@
+