From 047c13f5b8edd828533188856cf05384576ba309 Mon Sep 17 00:00:00 2001
From: Axel Niklasson <axeln@uber.com>
Date: Wed, 21 Nov 2018 20:05:42 +0100
Subject: [PATCH 1/5] First version of support for custom rate limiters
 dynamically loaded at runtime

---
 .../RDDAndDStreamCommonJavaFunctions.java     | 26 ++++++++------
 .../spark/connector/RDDFunctions.scala        |  1 -
 .../connector/rdd/CassandraJoinRDD.scala      |  8 +++--
 .../connector/rdd/CassandraLeftJoinRDD.scala  |  7 ++--
 .../spark/connector/rdd/CassandraRDD.scala    |  2 --
 .../spark/connector/rdd/ReadConf.scala        | 20 ++++++++---
 .../connector/util/RateLimiterUtil.scala      | 36 +++++++++++++++++++
 .../connector/writer/BaseRateLimiter.scala    |  5 +++
 ...ter.scala => LeakyBucketRateLimiter.scala} | 11 +++---
 .../writer/RateLimiterProvider.scala          | 26 ++++++++++++++
 .../spark/connector/writer/TableWriter.scala  | 12 ++++---
 .../spark/connector/writer/WriteConf.scala    | 26 ++++++++++----
 ...scala => LeakyBucketRateLimiterSpec.scala} |  8 ++---
 13 files changed, 145 insertions(+), 43 deletions(-)
 create mode 100644 spark-cassandra-connector/src/main/scala/com/datastax/spark/connector/util/RateLimiterUtil.scala
 create mode 100644 spark-cassandra-connector/src/main/scala/com/datastax/spark/connector/writer/BaseRateLimiter.scala
 rename spark-cassandra-connector/src/main/scala/com/datastax/spark/connector/writer/{RateLimiter.scala => LeakyBucketRateLimiter.scala} (92%)
 create mode 100644 spark-cassandra-connector/src/main/scala/com/datastax/spark/connector/writer/RateLimiterProvider.scala
 rename spark-cassandra-connector/src/test/scala/com/datastax/spark/connector/writer/{RateLimiterSpec.scala => LeakyBucketRateLimiterSpec.scala} (83%)

diff --git a/spark-cassandra-connector/src/main/java/com/datastax/spark/connector/japi/RDDAndDStreamCommonJavaFunctions.java b/spark-cassandra-connector/src/main/java/com/datastax/spark/connector/japi/RDDAndDStreamCommonJavaFunctions.java
index 045263039..f7e07abd6 100644
--- a/spark-cassandra-connector/src/main/java/com/datastax/spark/connector/japi/RDDAndDStreamCommonJavaFunctions.java
+++ b/spark-cassandra-connector/src/main/java/com/datastax/spark/connector/japi/RDDAndDStreamCommonJavaFunctions.java
@@ -178,7 +178,7 @@ public WriterBuilder withBatchSize(BatchSize batchSize) {
                     new WriteConf(batchSize, writeConf.batchGroupingBufferSize(), writeConf.batchGroupingKey(),
                         writeConf.consistencyLevel(), writeConf.ifNotExists(), writeConf.ignoreNulls(),
                         writeConf.parallelismLevel(), writeConf.throughputMiBPS(), writeConf.ttl(), writeConf.timestamp(),
-                        writeConf.taskMetricsEnabled()));
+                        writeConf.taskMetricsEnabled(), writeConf.rateLimiterProvider()));
             else
                 return this;
         }
@@ -197,7 +197,7 @@ public WriterBuilder withBatchGroupingBufferSize(int batchGroupingBufferSize) {
                     new WriteConf(writeConf.batchSize(), batchGroupingBufferSize, writeConf.batchGroupingKey(),
                         writeConf.consistencyLevel(), writeConf.ifNotExists(), writeConf.ignoreNulls(),
                         writeConf.parallelismLevel(), writeConf.throughputMiBPS(), writeConf.ttl(), writeConf.timestamp(),
-                        writeConf.taskMetricsEnabled()));
+                            writeConf.taskMetricsEnabled(), writeConf.rateLimiterProvider()));
             else
                 return this;
         }
@@ -216,7 +216,7 @@ public WriterBuilder withBatchGroupingKey(BatchGroupingKey batchGroupingKey) {
                     new WriteConf(writeConf.batchSize(), writeConf.batchGroupingBufferSize(), batchGroupingKey,
                         writeConf.consistencyLevel(), writeConf.ifNotExists(), writeConf.ignoreNulls(),
                         writeConf.parallelismLevel(), writeConf.throughputMiBPS(), writeConf.ttl(), writeConf.timestamp(),
-                        writeConf.taskMetricsEnabled()));
+                        writeConf.taskMetricsEnabled(), writeConf.rateLimiterProvider()));
             else
                 return this;
         }
@@ -234,7 +234,8 @@ public WriterBuilder withConsistencyLevel(ConsistencyLevel consistencyLevel) {
                 return withWriteConf(
                     new WriteConf(writeConf.batchSize(), writeConf.batchGroupingBufferSize(), writeConf.batchGroupingKey(),
                         consistencyLevel, writeConf.ifNotExists(), writeConf.ignoreNulls(), writeConf.parallelismLevel(),
-                        writeConf.throughputMiBPS(), writeConf.ttl(), writeConf.timestamp(), writeConf.taskMetricsEnabled()));
+                        writeConf.throughputMiBPS(), writeConf.ttl(), writeConf.timestamp(), writeConf.taskMetricsEnabled(),
+                        writeConf.rateLimiterProvider()));
             else
                 return this;
         }
@@ -252,7 +253,8 @@ public WriterBuilder withParallelismLevel(int parallelismLevel) {
                 return withWriteConf(
                     new WriteConf(writeConf.batchSize(), writeConf.batchGroupingBufferSize(), writeConf.batchGroupingKey(),
                         writeConf.consistencyLevel(), writeConf.ifNotExists(), writeConf.ignoreNulls(), parallelismLevel,
-                        writeConf.throughputMiBPS(), writeConf.ttl(), writeConf.timestamp(), writeConf.taskMetricsEnabled()));
+                        writeConf.throughputMiBPS(), writeConf.ttl(), writeConf.timestamp(), writeConf.taskMetricsEnabled(),
+                        writeConf.rateLimiterProvider()));
             else
                 return this;
         }
@@ -271,7 +273,7 @@ public WriterBuilder withThroughputMBPS(int throughputMBPS) {
                     new WriteConf(writeConf.batchSize(), writeConf.batchGroupingBufferSize(), writeConf.batchGroupingKey(),
                         writeConf.consistencyLevel(), writeConf.ifNotExists(), writeConf.ignoreNulls(),
                         writeConf.parallelismLevel(), throughputMBPS, writeConf.ttl(), writeConf.timestamp(),
-                        writeConf.taskMetricsEnabled()));
+                        writeConf.taskMetricsEnabled(), writeConf.rateLimiterProvider()));
             else
               return this;
         }
@@ -290,7 +292,7 @@ public WriterBuilder withTaskMetricsEnabled(boolean taskMetricsEnabled) {
                         new WriteConf(writeConf.batchSize(), writeConf.batchGroupingBufferSize(), writeConf.batchGroupingKey(),
                                 writeConf.consistencyLevel(), writeConf.ifNotExists(), writeConf.ignoreNulls(),
                                 writeConf.parallelismLevel(), writeConf.throughputMiBPS(), writeConf.ttl(),
-                                writeConf.timestamp(), taskMetricsEnabled));
+                                writeConf.timestamp(), taskMetricsEnabled, writeConf.rateLimiterProvider()));
             else
                 return this;
         }
@@ -307,7 +309,7 @@ public WriterBuilder withIfNotExists(boolean ifNotExists) {
                 return withWriteConf(
                         new WriteConf(writeConf.batchSize(), writeConf.batchGroupingBufferSize(), writeConf.batchGroupingKey(),
                                 writeConf.consistencyLevel(), ifNotExists, writeConf.ignoreNulls(), writeConf.parallelismLevel(),
-                                writeConf.throughputMiBPS(), writeConf.ttl(), writeConf.timestamp(), writeConf.taskMetricsEnabled()));
+                                writeConf.throughputMiBPS(), writeConf.ttl(), writeConf.timestamp(), writeConf.taskMetricsEnabled(), writeConf.rateLimiterProvider()));
             else
                 return this;
         }
@@ -324,7 +326,7 @@ public WriterBuilder withIgnoreNulls(boolean ignoreNulls) {
                 return withWriteConf(
                         new WriteConf(writeConf.batchSize(), writeConf.batchGroupingBufferSize(), writeConf.batchGroupingKey(),
                                 writeConf.consistencyLevel(), writeConf.ifNotExists(), ignoreNulls, writeConf.parallelismLevel(),
-                                writeConf.throughputMiBPS(), writeConf.ttl(), writeConf.timestamp(), writeConf.taskMetricsEnabled()));
+                                writeConf.throughputMiBPS(), writeConf.ttl(), writeConf.timestamp(), writeConf.taskMetricsEnabled(), writeConf.rateLimiterProvider()));
             else
                 return this;
         }
@@ -343,7 +345,8 @@ private WriterBuilder withTimestamp(TimestampOption timestamp) {
                     writeConf.throughputMiBPS(),
                     writeConf.ttl(),
                     timestamp,
-                    writeConf.taskMetricsEnabled()));
+                    writeConf.taskMetricsEnabled(),
+                    writeConf.rateLimiterProvider()));
         }
 
 
@@ -424,7 +427,8 @@ private WriterBuilder withTTL(TTLOption ttl) {
                     writeConf.throughputMiBPS(),
                     ttl,
                     writeConf.timestamp(),
-                    writeConf.taskMetricsEnabled()));
+                    writeConf.taskMetricsEnabled(),
+                    writeConf.rateLimiterProvider()));
         }
 
         /**
diff --git a/spark-cassandra-connector/src/main/scala/com/datastax/spark/connector/RDDFunctions.scala b/spark-cassandra-connector/src/main/scala/com/datastax/spark/connector/RDDFunctions.scala
index 3cc6646aa..2f7819db1 100644
--- a/spark-cassandra-connector/src/main/scala/com/datastax/spark/connector/RDDFunctions.scala
+++ b/spark-cassandra-connector/src/main/scala/com/datastax/spark/connector/RDDFunctions.scala
@@ -31,7 +31,6 @@ class RDDFunctions[T](rdd: RDD[T]) extends WritableToCassandra[T] with Serializa
   implicit
     connector: CassandraConnector = CassandraConnector(sparkContext),
     rwf: RowWriterFactory[T]): Unit = {
-
     val writer = TableWriter(connector, keyspaceName, tableName, columns, writeConf)
     rdd.sparkContext.runJob(rdd, writer.write _)
   }
diff --git a/spark-cassandra-connector/src/main/scala/com/datastax/spark/connector/rdd/CassandraJoinRDD.scala b/spark-cassandra-connector/src/main/scala/com/datastax/spark/connector/rdd/CassandraJoinRDD.scala
index 31d1c8630..f25aa4bfe 100644
--- a/spark-cassandra-connector/src/main/scala/com/datastax/spark/connector/rdd/CassandraJoinRDD.scala
+++ b/spark-cassandra-connector/src/main/scala/com/datastax/spark/connector/rdd/CassandraJoinRDD.scala
@@ -5,6 +5,7 @@ import com.datastax.spark.connector._
 import com.datastax.spark.connector.cql._
 import com.datastax.spark.connector.rdd.reader._
 import com.datastax.spark.connector.writer._
+import com.datastax.spark.connector.util.RateLimiterUtil
 import com.google.common.util.concurrent.{FutureCallback, Futures, SettableFuture}
 import org.apache.spark.rdd.RDD
 
@@ -118,10 +119,11 @@ class CassandraJoinRDD[L, R] private[connector](
     rowMetadata: CassandraRowMetadata,
     leftIterator: Iterator[L]
   ): Iterator[(L, R)] = {
-    val rateLimiter = new RateLimiter(
-      readConf.readsPerSec, readConf.readsPerSec
+    val rateLimiter = RateLimiterUtil.getRateLimiter(
+      readConf.rateLimiterProvider,
+      readConf.readsPerSec,
+      readConf.readsPerSec
     )
-
     val queryExecutor = QueryExecutor(session, readConf.parallelismLevel, None, None)
 
     def pairWithRight(left: L): SettableFuture[Iterator[(L, R)]] = {
diff --git a/spark-cassandra-connector/src/main/scala/com/datastax/spark/connector/rdd/CassandraLeftJoinRDD.scala b/spark-cassandra-connector/src/main/scala/com/datastax/spark/connector/rdd/CassandraLeftJoinRDD.scala
index 1a76288ea..db7cdb7a3 100644
--- a/spark-cassandra-connector/src/main/scala/com/datastax/spark/connector/rdd/CassandraLeftJoinRDD.scala
+++ b/spark-cassandra-connector/src/main/scala/com/datastax/spark/connector/rdd/CassandraLeftJoinRDD.scala
@@ -4,6 +4,7 @@ import com.datastax.driver.core.{ResultSet, Session}
 import com.datastax.spark.connector._
 import com.datastax.spark.connector.cql._
 import com.datastax.spark.connector.rdd.reader._
+import com.datastax.spark.connector.util.RateLimiterUtil
 import com.datastax.spark.connector.writer._
 import com.google.common.util.concurrent.{FutureCallback, Futures, SettableFuture}
 import org.apache.spark.rdd.RDD
@@ -141,8 +142,10 @@ class CassandraLeftJoinRDD[L, R] private[connector](
     rowMetadata: CassandraRowMetadata,
     leftIterator: Iterator[L]
   ): Iterator[(L, Option[R])] = {
-    val rateLimiter = new RateLimiter(
-      readConf.readsPerSec, readConf.readsPerSec
+    val rateLimiter = RateLimiterUtil.getRateLimiter(
+      readConf.rateLimiterProvider,
+      readConf.readsPerSec,
+      readConf.readsPerSec
     )
 
     val queryExecutor = QueryExecutor(session, readConf.parallelismLevel,None, None)
diff --git a/spark-cassandra-connector/src/main/scala/com/datastax/spark/connector/rdd/CassandraRDD.scala b/spark-cassandra-connector/src/main/scala/com/datastax/spark/connector/rdd/CassandraRDD.scala
index 8ec614c88..0740163fe 100644
--- a/spark-cassandra-connector/src/main/scala/com/datastax/spark/connector/rdd/CassandraRDD.scala
+++ b/spark-cassandra-connector/src/main/scala/com/datastax/spark/connector/rdd/CassandraRDD.scala
@@ -1,6 +1,5 @@
 package com.datastax.spark.connector.rdd
 
-import com.datastax.driver.core.HostDistance
 import com.datastax.spark.connector.cql._
 import com.datastax.spark.connector.rdd.ClusteringOrder.{Ascending, Descending}
 import com.datastax.spark.connector.rdd.reader._
@@ -27,7 +26,6 @@ abstract class CassandraRDD[R : ClassTag](
   
   ConfigCheck.checkConfig(sc.getConf)
 
-
   protected[connector] def keyspaceName: String
 
   protected[connector] def tableName: String
diff --git a/spark-cassandra-connector/src/main/scala/com/datastax/spark/connector/rdd/ReadConf.scala b/spark-cassandra-connector/src/main/scala/com/datastax/spark/connector/rdd/ReadConf.scala
index 6c65a28d6..97208f310 100644
--- a/spark-cassandra-connector/src/main/scala/com/datastax/spark/connector/rdd/ReadConf.scala
+++ b/spark-cassandra-connector/src/main/scala/com/datastax/spark/connector/rdd/ReadConf.scala
@@ -15,7 +15,9 @@ import org.apache.spark.SparkConf
   * @param taskMetricsEnabled whether or not enable task metrics updates (requires Spark 1.2+)
   * @param readsPerSec maximum read throughput allowed per single core in requests/s while
   *                                  joining an RDD with C* table (joinWithCassandraTable operation)
-  *                                  also used by enterprise integrations*/
+  *                                  also used by enterprise integrations
+  * @param rateLimiterProvider fully qualified name to a custom rate limiter provider
+  */
 case class ReadConf(
   splitCount: Option[Int] = None,
   splitSizeInMB: Int = ReadConf.SplitSizeInMBParam.default,
@@ -23,7 +25,8 @@ case class ReadConf(
   consistencyLevel: ConsistencyLevel = ReadConf.ConsistencyLevelParam.default,
   taskMetricsEnabled: Boolean = ReadConf.TaskMetricParam.default,
   parallelismLevel: Int = ReadConf.ParallelismLevelParam.default,
-  readsPerSec: Int = ReadConf.ReadsPerSecParam.default
+  readsPerSec: Int = ReadConf.ReadsPerSecParam.default,
+  rateLimiterProvider: String = ReadConf.RateLimiterProviderParam.default
 )
 
 
@@ -93,6 +96,13 @@ object ReadConf extends Logging {
       """Sets max requests per core per second for joinWithCassandraTable and some Enterprise integrations"""
   )
 
+  val RateLimiterProviderParam = ConfigParameter[String] (
+    name = "spark.cassandra.read.ratelimiter.provider",
+    section = ReferenceSection,
+    default = "com.datastax.spark.connector.writer.LeakyBucketProvider",
+    description = """Determines which rate limiter provider to use in reads"""
+  )
+
   // Whitelist for allowed Read environment variables
   val Properties = Set(
     SplitCountParam,
@@ -102,7 +112,8 @@ object ReadConf extends Logging {
     SplitSizeInMBParam,
     TaskMetricParam,
     ThroughputJoinQueryPerSecParam,
-    ParallelismLevelParam
+    ParallelismLevelParam,
+    RateLimiterProviderParam
   )
 
   def fromSparkConf(conf: SparkConf): ReadConf = {
@@ -136,7 +147,8 @@ object ReadConf extends Logging {
       readsPerSec = conf.getInt(ReadsPerSecParam.name,
         throughtputJoinQueryPerSec.getOrElse(ReadsPerSecParam.default)),
       parallelismLevel = conf.getInt(ParallelismLevelParam.name, ParallelismLevelParam.default),
-      splitCount = conf.getOption(SplitCountParam.name).map(_.toInt)
+      splitCount = conf.getOption(SplitCountParam.name).map(_.toInt),
+      rateLimiterProvider = conf.get(RateLimiterProviderParam.name, RateLimiterProviderParam.default)
     )
   }
 
diff --git a/spark-cassandra-connector/src/main/scala/com/datastax/spark/connector/util/RateLimiterUtil.scala b/spark-cassandra-connector/src/main/scala/com/datastax/spark/connector/util/RateLimiterUtil.scala
new file mode 100644
index 000000000..a3ea85e87
--- /dev/null
+++ b/spark-cassandra-connector/src/main/scala/com/datastax/spark/connector/util/RateLimiterUtil.scala
@@ -0,0 +1,36 @@
+package com.datastax.spark.connector.util
+
+import com.datastax.spark.connector.writer.{BaseRateLimiter, LeakyBucketProvider, RateLimiterProvider}
+
+object RateLimiterUtil {
+  var provider:RateLimiterProvider = _
+  var providerClassName:String = "com.datastax.spark.connector.writer.LeakyBucketProvider"
+
+  // get rate limiter from provider specified by className
+  def getRateLimiter(className: String, args: Any*): BaseRateLimiter = {
+    setProviderClassName(className)
+    println("Getting rate limiter with specified conf from " + provider.getClass.getName)
+    provider.getWithConf(args:_*)
+  }
+
+  // get standard rate limiter
+//  def getRateLimiter(args: Any*): BaseRateLimiter = {
+//    println("Getting rate limiter from " + provider.getClass.getName)
+//    provider.getWithConf(args:_*)
+//  }
+
+//  def setProvider(customProvider: RateLimiterProvider): Unit = {
+//    println("Setting rate limiter provider to be " + customProvider.getClass.getName)
+//    provider = customProvider
+//  }
+
+  private def setProviderClassName(className: String): Unit = {
+    providerClassName = className
+
+    try {
+      provider = Class.forName(providerClassName).newInstance.asInstanceOf[RateLimiterProvider]
+    } catch {
+      case e:Exception => println("ERROR: " + e)
+    }
+  }
+}
\ No newline at end of file
diff --git a/spark-cassandra-connector/src/main/scala/com/datastax/spark/connector/writer/BaseRateLimiter.scala b/spark-cassandra-connector/src/main/scala/com/datastax/spark/connector/writer/BaseRateLimiter.scala
new file mode 100644
index 000000000..e9306c606
--- /dev/null
+++ b/spark-cassandra-connector/src/main/scala/com/datastax/spark/connector/writer/BaseRateLimiter.scala
@@ -0,0 +1,5 @@
+package com.datastax.spark.connector.writer
+
+trait BaseRateLimiter {
+  def maybeSleep(packetSize: Long): Unit
+}
diff --git a/spark-cassandra-connector/src/main/scala/com/datastax/spark/connector/writer/RateLimiter.scala b/spark-cassandra-connector/src/main/scala/com/datastax/spark/connector/writer/LeakyBucketRateLimiter.scala
similarity index 92%
rename from spark-cassandra-connector/src/main/scala/com/datastax/spark/connector/writer/RateLimiter.scala
rename to spark-cassandra-connector/src/main/scala/com/datastax/spark/connector/writer/LeakyBucketRateLimiter.scala
index 7d9067b1d..d1052afb9 100644
--- a/spark-cassandra-connector/src/main/scala/com/datastax/spark/connector/writer/RateLimiter.scala
+++ b/spark-cassandra-connector/src/main/scala/com/datastax/spark/connector/writer/LeakyBucketRateLimiter.scala
@@ -22,11 +22,11 @@ import scala.annotation.tailrec
   * @param sleep a function to call to slow down the calling thread;
   *              must use the same time units as `time`
   */
-class RateLimiter(
-    rate: Long,
-    bucketSize: Long,
-    time: () => Long = System.currentTimeMillis,
-    sleep: Long => Any = Thread.sleep) {
+class LeakyBucketRateLimiter(
+  rate: Long,
+  bucketSize: Long,
+  time: () => Long = System.currentTimeMillis,
+  sleep: Long => Any = Thread.sleep) extends BaseRateLimiter {
 
   require(rate > 0, "A positive rate is required")
   require(bucketSize > 0, "A positive bucket size is required")
@@ -62,5 +62,4 @@ class RateLimiter(
     if (delay > 0L)
       sleep(delay)
   }
-
 }
diff --git a/spark-cassandra-connector/src/main/scala/com/datastax/spark/connector/writer/RateLimiterProvider.scala b/spark-cassandra-connector/src/main/scala/com/datastax/spark/connector/writer/RateLimiterProvider.scala
new file mode 100644
index 000000000..0d243c6d7
--- /dev/null
+++ b/spark-cassandra-connector/src/main/scala/com/datastax/spark/connector/writer/RateLimiterProvider.scala
@@ -0,0 +1,26 @@
+package com.datastax.spark.connector.writer
+
+trait RateLimiterProvider {
+  def getWithConf(args: Any*): BaseRateLimiter
+}
+
+class LeakyBucketProvider extends RateLimiterProvider {
+  override def getWithConf(args: Any*): BaseRateLimiter = {
+    require(args.length >= 2)
+
+    val rate= args(0) match {
+      case x:Int => x.intValue()
+      case x:Long => x.longValue()
+    }
+
+    val bucketSize = args(1) match {
+      case x:Int => x.intValue()
+      case x:Long => x.longValue()
+    }
+
+    val time:() => Long = if (args.length >= 3) args(2).asInstanceOf[() => Long] else System.currentTimeMillis
+    val sleep:Long => Any = if (args.length >= 4) args(3).asInstanceOf[Long => Any] else Thread.sleep
+
+    new LeakyBucketRateLimiter(rate, bucketSize, time, sleep)
+  }
+}
diff --git a/spark-cassandra-connector/src/main/scala/com/datastax/spark/connector/writer/TableWriter.scala b/spark-cassandra-connector/src/main/scala/com/datastax/spark/connector/writer/TableWriter.scala
index 097bd4102..5ace698ce 100644
--- a/spark-cassandra-connector/src/main/scala/com/datastax/spark/connector/writer/TableWriter.scala
+++ b/spark-cassandra-connector/src/main/scala/com/datastax/spark/connector/writer/TableWriter.scala
@@ -8,7 +8,7 @@ import com.datastax.spark.connector._
 import com.datastax.spark.connector.cql._
 import com.datastax.spark.connector.types.{CollectionColumnType, ListType, MapType}
 import com.datastax.spark.connector.util.Quote._
-import com.datastax.spark.connector.util.{CountingIterator, Logging}
+import com.datastax.spark.connector.util.{CountingIterator, Logging, RateLimiterUtil}
 import org.apache.spark.TaskContext
 import org.apache.spark.metrics.OutputMetricsUpdater
 
@@ -193,8 +193,9 @@ class TableWriter[T] private (
   /**
     * Write data with Cql INSERT statement
     */
-  def insert(taskContext: TaskContext, data: Iterator[T]):Unit =
+  def insert(taskContext: TaskContext, data: Iterator[T]):Unit = {
     writeInternal(queryTemplateUsingInsert, taskContext, data)
+  }
 
   /**
     * Cql DELETE statement
@@ -226,8 +227,11 @@ class TableWriter[T] private (
       val batchKeyGenerator = batchRoutingKey(session, routingKeyGenerator) _
       val batchBuilder = new GroupingBatchBuilder(boundStmtBuilder, batchStmtBuilder, batchKeyGenerator,
         writeConf.batchSize, writeConf.batchGroupingBufferSize, rowIterator)
-      val rateLimiter = new RateLimiter((writeConf.throughputMiBPS * 1024 * 1024).toLong, 1024 * 1024)
-
+      val rateLimiter = RateLimiterUtil.getRateLimiter(
+        writeConf.rateLimiterProvider,
+        (writeConf.throughputMiBPS * 1024 * 1024).toLong,
+        1024 * 1024
+      )
       logDebug(s"Writing data partition to $keyspaceName.$tableName in batches of ${writeConf.batchSize}.")
 
       for (stmtToWrite <- batchBuilder) {
diff --git a/spark-cassandra-connector/src/main/scala/com/datastax/spark/connector/writer/WriteConf.scala b/spark-cassandra-connector/src/main/scala/com/datastax/spark/connector/writer/WriteConf.scala
index 2d39ba8e0..7b03b756c 100644
--- a/spark-cassandra-connector/src/main/scala/com/datastax/spark/connector/writer/WriteConf.scala
+++ b/spark-cassandra-connector/src/main/scala/com/datastax/spark/connector/writer/WriteConf.scala
@@ -2,8 +2,9 @@ package com.datastax.spark.connector.writer
 
 import com.datastax.driver.core.{ConsistencyLevel, DataType}
 import com.datastax.spark.connector.cql.{ColumnDef, RegularColumn}
+import com.datastax.spark.connector.rdd.ReadConf
 import com.datastax.spark.connector.types.ColumnType
-import com.datastax.spark.connector.util.{ConfigParameter, ConfigCheck}
+import com.datastax.spark.connector.util.{ConfigCheck, ConfigParameter}
 import com.datastax.spark.connector.{BatchSize, BytesInBatch, RowsInBatch}
 import org.apache.commons.configuration.ConfigurationException
 import org.apache.spark.SparkConf
@@ -21,6 +22,7 @@ import org.apache.spark.SparkConf
   * @param ttl       the default TTL value which is used when it is defined (in seconds)
   * @param timestamp the default timestamp value which is used when it is defined (in microseconds)
   * @param taskMetricsEnabled whether or not enable task metrics updates (requires Spark 1.2+)
+  * @param rateLimiterProvider fully qualified name to a custom rate limiter provider
   */
 
 case class WriteConf(batchSize: BatchSize = BatchSize.Automatic,
@@ -33,7 +35,8 @@ case class WriteConf(batchSize: BatchSize = BatchSize.Automatic,
                      throughputMiBPS: Double = WriteConf.ThroughputMiBPSParam.default,
                      ttl: TTLOption = TTLOption.defaultValue,
                      timestamp: TimestampOption = TimestampOption.defaultValue,
-                     taskMetricsEnabled: Boolean = WriteConf.TaskMetricsParam.default) {
+                     taskMetricsEnabled: Boolean = WriteConf.TaskMetricsParam.default,
+                     rateLimiterProvider: String = WriteConf.RateLimiterProviderParam.default) {
 
   private[writer] val optionPlaceholders: Seq[String] = Seq(ttl, timestamp).collect {
     case WriteOption(PerRowWriteOptionValue(placeholder)) => placeholder
@@ -123,7 +126,7 @@ object WriteConf {
     default = 5,
     description = """Maximum number of batches executed in parallel by a
       | single Spark task""".stripMargin)
-  
+
   val ThroughputMiBPSParam = ConfigParameter[Double] (
     name = "spark.cassandra.output.throughput_mb_per_sec",
     section = ReferenceSection,
@@ -154,6 +157,13 @@ object WriteConf {
     description = """Sets whether to record connector specific metrics on write"""
   )
 
+  val RateLimiterProviderParam = ConfigParameter[String](
+    name = "spark.cassandra.write.ratelimiter.provider",
+    section = ReferenceSection,
+    default = "com.datastax.spark.connector.writer.LeakyBucketProvider",
+    description = """Determines which rate limiter provider to use in writes"""
+  )
+
   // Whitelist for allowed Write environment variables
   val Properties: Set[ConfigParameter[_]] = Set(
     BatchSizeBytesParam,
@@ -167,7 +177,8 @@ object WriteConf {
     ThroughputMiBPSParam,
     TTLParam,
     TimestampParam,
-    TaskMetricsParam
+    TaskMetricsParam,
+    RateLimiterProviderParam
   )
 
   def fromSparkConf(conf: SparkConf): WriteConf = {
@@ -215,7 +226,7 @@ object WriteConf {
         TTLOption.defaultValue
       else
         TTLOption.constant(ttlSeconds)
-    
+
     val timestampMicros = conf.getLong(TimestampParam.name, TimestampParam.default)
 
     val timestampOption =
@@ -224,6 +235,8 @@ object WriteConf {
       else
         TimestampOption.constant(timestampMicros)
 
+    val rateLimiterProvider = conf.get(RateLimiterProviderParam.name, RateLimiterProviderParam.default)
+
     WriteConf(
       batchSize = batchSize,
       batchGroupingBufferSize = batchBufferSize,
@@ -235,7 +248,8 @@ object WriteConf {
       ttl = ttlOption,
       timestamp = timestampOption,
       ignoreNulls = ignoreNulls,
-      ifNotExists = ifNotExists)
+      ifNotExists = ifNotExists,
+      rateLimiterProvider = rateLimiterProvider)
   }
 
 }
diff --git a/spark-cassandra-connector/src/test/scala/com/datastax/spark/connector/writer/RateLimiterSpec.scala b/spark-cassandra-connector/src/test/scala/com/datastax/spark/connector/writer/LeakyBucketRateLimiterSpec.scala
similarity index 83%
rename from spark-cassandra-connector/src/test/scala/com/datastax/spark/connector/writer/RateLimiterSpec.scala
rename to spark-cassandra-connector/src/test/scala/com/datastax/spark/connector/writer/LeakyBucketRateLimiterSpec.scala
index 95cfe0763..78017d2ad 100644
--- a/spark-cassandra-connector/src/test/scala/com/datastax/spark/connector/writer/RateLimiterSpec.scala
+++ b/spark-cassandra-connector/src/test/scala/com/datastax/spark/connector/writer/LeakyBucketRateLimiterSpec.scala
@@ -5,7 +5,7 @@ import org.scalatest.concurrent.Eventually
 import org.scalatest.{FlatSpec, Matchers}
 
 
-class RateLimiterSpec extends FlatSpec with Matchers with MockFactory with Eventually{
+class LeakyBucketRateLimiterSpec extends FlatSpec with Matchers with MockFactory with Eventually{
 
  val TestRates = Seq(1L, 2L, 4L, 6L, 8L, 16L, 32L, WriteConf.ThroughputMiBPSParam.default.toLong)
 
@@ -14,7 +14,7 @@ class RateLimiterSpec extends FlatSpec with Matchers with MockFactory with Event
     val sleep = mockFunction[Long, Any]("sleep")
     sleep.expects(*).never()
 
-    val limiter = new RateLimiter(Long.MaxValue, 1000, () => now, sleep)
+    val limiter = new LeakyBucketRateLimiter(Long.MaxValue, 1000, () => now, sleep)
     for (i <- 1 to 1000000) {
       now += 1
       limiter.maybeSleep(1000)
@@ -33,7 +33,7 @@ class RateLimiterSpec extends FlatSpec with Matchers with MockFactory with Event
     // 10 units per second + 5 units burst allowed
     val bucketSize = 5
     val rate = 10
-    val limiter = new RateLimiter(rate, bucketSize, () => now, sleep)
+    val limiter = new LeakyBucketRateLimiter(rate, bucketSize, () => now, sleep)
 
     val iterations = 25
     for (i <- 1 to iterations)
@@ -53,7 +53,7 @@ class RateLimiterSpec extends FlatSpec with Matchers with MockFactory with Event
         now += delay
       }
 
-      val limiter = new RateLimiter(rate, rate * 2, () => now, sleep)
+      val limiter = new LeakyBucketRateLimiter(rate, rate * 2, () => now, sleep)
       for (leakNum <- 1 to 1000) {
         assert(
           limiter.bucketFill.get() >= 0,

From a573e07b7017700e917c5d1b13b5a902046a7488 Mon Sep 17 00:00:00 2001
From: Axel Niklasson <axeln@uber.com>
Date: Mon, 26 Nov 2018 15:34:43 +0100
Subject: [PATCH 2/5] Refactor and comments

---
 .../connector/util/RateLimiterUtil.scala      | 46 +++++++++----------
 .../LeakyBucketRateLimiterProvider.scala      | 36 +++++++++++++++
 .../writer/RateLimiterProvider.scala          | 34 +++++---------
 3 files changed, 68 insertions(+), 48 deletions(-)
 create mode 100644 spark-cassandra-connector/src/main/scala/com/datastax/spark/connector/writer/LeakyBucketRateLimiterProvider.scala

diff --git a/spark-cassandra-connector/src/main/scala/com/datastax/spark/connector/util/RateLimiterUtil.scala b/spark-cassandra-connector/src/main/scala/com/datastax/spark/connector/util/RateLimiterUtil.scala
index a3ea85e87..8f5cd23f2 100644
--- a/spark-cassandra-connector/src/main/scala/com/datastax/spark/connector/util/RateLimiterUtil.scala
+++ b/spark-cassandra-connector/src/main/scala/com/datastax/spark/connector/util/RateLimiterUtil.scala
@@ -1,36 +1,32 @@
 package com.datastax.spark.connector.util
 
-import com.datastax.spark.connector.writer.{BaseRateLimiter, LeakyBucketProvider, RateLimiterProvider}
+import com.datastax.spark.connector.writer.{BaseRateLimiter, RateLimiterProvider}
+import main.scala.com.datastax.spark.connector.writer.LeakyBucketRateLimiterProvider
 
-object RateLimiterUtil {
+/**
+  * Exports a method to retrieve a custom rate limiter based on dynamic configuration.
+  */
+object RateLimiterUtil extends Logging {
   var provider:RateLimiterProvider = _
-  var providerClassName:String = "com.datastax.spark.connector.writer.LeakyBucketProvider"
 
-  // get rate limiter from provider specified by className
+  /**
+    * Instantiates a rate limiter provider based on its fully qualified classname and should that not be possible,
+    * fallbacks to the leaky bucket rate limiter provider in this project.
+    *
+    * @param className fully qualified classname of the rate limiter provider to instantiate
+    * @param args optional sequence of arguments passed on to the provider
+    * @return an instantiated rate limiter
+    */
   def getRateLimiter(className: String, args: Any*): BaseRateLimiter = {
-    setProviderClassName(className)
-    println("Getting rate limiter with specified conf from " + provider.getClass.getName)
-    provider.getWithConf(args:_*)
-  }
-
-  // get standard rate limiter
-//  def getRateLimiter(args: Any*): BaseRateLimiter = {
-//    println("Getting rate limiter from " + provider.getClass.getName)
-//    provider.getWithConf(args:_*)
-//  }
-
-//  def setProvider(customProvider: RateLimiterProvider): Unit = {
-//    println("Setting rate limiter provider to be " + customProvider.getClass.getName)
-//    provider = customProvider
-//  }
-
-  private def setProviderClassName(className: String): Unit = {
-    providerClassName = className
-
     try {
-      provider = Class.forName(providerClassName).newInstance.asInstanceOf[RateLimiterProvider]
+      provider = Class.forName(className).newInstance.asInstanceOf[RateLimiterProvider]
     } catch {
-      case e:Exception => println("ERROR: " + e)
+      case e:Exception => {
+        logError("Could not instantiate custom rate limiter provider. Error: " + e)
+        provider = LeakyBucketRateLimiterProvider
+      }
     }
+
+    provider.getRateLimiterWithConf(args:_*)
   }
 }
\ No newline at end of file
diff --git a/spark-cassandra-connector/src/main/scala/com/datastax/spark/connector/writer/LeakyBucketRateLimiterProvider.scala b/spark-cassandra-connector/src/main/scala/com/datastax/spark/connector/writer/LeakyBucketRateLimiterProvider.scala
new file mode 100644
index 000000000..10b22d52f
--- /dev/null
+++ b/spark-cassandra-connector/src/main/scala/com/datastax/spark/connector/writer/LeakyBucketRateLimiterProvider.scala
@@ -0,0 +1,36 @@
+package main.scala.com.datastax.spark.connector.writer
+
+import com.datastax.spark.connector.util.Logging
+import com.datastax.spark.connector.writer.{BaseRateLimiter, LeakyBucketRateLimiter, RateLimiterProvider}
+
+/**
+  * Instantiates a leaky bucket rate limiter based on the supplied configuration.
+  */
+object LeakyBucketRateLimiterProvider extends RateLimiterProvider with Logging {
+  override def getRateLimiterWithConf(args: Any*): BaseRateLimiter = {
+    val rate = args(0).asInstanceOf[Number].longValue
+    val bucketSize = args(1).asInstanceOf[Number].longValue
+
+    /**
+      * If optional arguments are present and cannot be casted correctly,
+      * omit them and instantiate rate limiter with only rate and bucketSize
+      */
+    try {
+      if (args.size > 2) {
+        val time = args(2).asInstanceOf[() => Long]
+        if (args.size > 3) {
+          val sleep = args(3).asInstanceOf[Long => Any]
+          new LeakyBucketRateLimiter(rate, bucketSize, time, sleep)
+        }
+        new LeakyBucketRateLimiter(rate, bucketSize, time)
+      }
+    } catch {
+      case _: Exception => {
+        logError("Invalid optional arguments when instantiating leaky bucket rate limiter")
+        new LeakyBucketRateLimiter(rate, bucketSize)
+      }
+    }
+
+    new LeakyBucketRateLimiter(rate, bucketSize)
+  }
+}
diff --git a/spark-cassandra-connector/src/main/scala/com/datastax/spark/connector/writer/RateLimiterProvider.scala b/spark-cassandra-connector/src/main/scala/com/datastax/spark/connector/writer/RateLimiterProvider.scala
index 0d243c6d7..1a4563dde 100644
--- a/spark-cassandra-connector/src/main/scala/com/datastax/spark/connector/writer/RateLimiterProvider.scala
+++ b/spark-cassandra-connector/src/main/scala/com/datastax/spark/connector/writer/RateLimiterProvider.scala
@@ -1,26 +1,14 @@
 package com.datastax.spark.connector.writer
 
+/**
+  * Represents a provider that creates and returns a rate limiter with possible configuration.
+  */
 trait RateLimiterProvider {
-  def getWithConf(args: Any*): BaseRateLimiter
-}
-
-class LeakyBucketProvider extends RateLimiterProvider {
-  override def getWithConf(args: Any*): BaseRateLimiter = {
-    require(args.length >= 2)
-
-    val rate= args(0) match {
-      case x:Int => x.intValue()
-      case x:Long => x.longValue()
-    }
-
-    val bucketSize = args(1) match {
-      case x:Int => x.intValue()
-      case x:Long => x.longValue()
-    }
-
-    val time:() => Long = if (args.length >= 3) args(2).asInstanceOf[() => Long] else System.currentTimeMillis
-    val sleep:Long => Any = if (args.length >= 4) args(3).asInstanceOf[Long => Any] else Thread.sleep
-
-    new LeakyBucketRateLimiter(rate, bucketSize, time, sleep)
-  }
-}
+  /**
+    * Given a set of arguments, instantiates and returns a rate limiter.
+    *
+    * @param args sequence of arguments that can customize the returned rate limiter
+    * @return the created rate limiter
+    */
+  def getRateLimiterWithConf(args: Any*): BaseRateLimiter
+}
\ No newline at end of file

From e10f7b7e0b47ff07efb75dfa6e8363403f54e77d Mon Sep 17 00:00:00 2001
From: Axel Niklasson <axeln@uber.com>
Date: Mon, 26 Nov 2018 16:43:52 +0100
Subject: [PATCH 3/5] Comments in BaseRateLimiter

---
 .../spark/connector/writer/BaseRateLimiter.scala      | 11 +++++++++++
 1 file changed, 11 insertions(+)

diff --git a/spark-cassandra-connector/src/main/scala/com/datastax/spark/connector/writer/BaseRateLimiter.scala b/spark-cassandra-connector/src/main/scala/com/datastax/spark/connector/writer/BaseRateLimiter.scala
index e9306c606..855d9a365 100644
--- a/spark-cassandra-connector/src/main/scala/com/datastax/spark/connector/writer/BaseRateLimiter.scala
+++ b/spark-cassandra-connector/src/main/scala/com/datastax/spark/connector/writer/BaseRateLimiter.scala
@@ -1,5 +1,16 @@
 package com.datastax.spark.connector.writer
 
+/**
+  * Represents a rate limiter.
+  */
 trait BaseRateLimiter {
+
+  /**
+    * Processes a single packet and it is up to the implementing class to determine whether
+    * or not the thread should sleep.
+    *
+    * @param packetSize the size of the packet currently being processed
+    */
   def maybeSleep(packetSize: Long): Unit
+
 }

From 2e4c34af246417cd90c00a02554954b56e9ad72c Mon Sep 17 00:00:00 2001
From: Axel Niklasson <axeln@uber.com>
Date: Tue, 27 Nov 2018 20:42:02 +0100
Subject: [PATCH 4/5] Comments and tests

---
 doc/reference.md                              | 10 +++++
 .../spark/connector/rdd/ReadConf.scala        |  7 ++--
 .../connector/util/RateLimiterUtil.scala      | 13 ++++--
 .../LeakyBucketRateLimiterProvider.scala      |  4 +-
 .../spark/connector/writer/WriteConf.scala    |  5 ++-
 .../spark/connector/rdd/ReadConfTest.scala    |  8 ++++
 .../connector/util/RateLimiterUtilSpec.scala  | 40 +++++++++++++++++++
 .../connector/writer/WriteConfTest.scala      |  7 ++++
 8 files changed, 85 insertions(+), 9 deletions(-)
 create mode 100644 spark-cassandra-connector/src/test/scala/com/datastax/spark/connector/util/RateLimiterUtilSpec.scala

diff --git a/doc/reference.md b/doc/reference.md
index f6a2856a9..1abc877e7 100644
--- a/doc/reference.md
+++ b/doc/reference.md
@@ -227,6 +227,11 @@ OSS Cassandra this should never be used.</td>
   <td>true</td>
   <td>Sets whether to record connector specific metrics on write</td>
 </tr>
+<tr>
+  <td><code>input.ratelimiterprovider</code></td>
+  <td>main.scala.com.datastax.spark.connector.writer.LeakyBucketRateLimiterProvider</td>
+  <td>Determines which rate limiter provider to use in reads</td>
+</tr>
 <tr>
   <td><code>input.reads_per_sec</code></td>
   <td>2147483647</td>
@@ -314,6 +319,11 @@ finer control see the CassandraOption class</td>
   <td>true</td>
   <td>Sets whether to record connector specific metrics on write</td>
 </tr>
+<tr>
+  <td><code>output.ratelimiterprovider</code></td>
+  <td>main.scala.com.datastax.spark.connector.writer.LeakyBucketRateLimiterProvider</td>
+  <td>Determines which rate limiter provider to use in writes</td>
+</tr>
 <tr>
   <td><code>output.throughput_mb_per_sec</code></td>
   <td>2.147483647E9</td>
diff --git a/spark-cassandra-connector/src/main/scala/com/datastax/spark/connector/rdd/ReadConf.scala b/spark-cassandra-connector/src/main/scala/com/datastax/spark/connector/rdd/ReadConf.scala
index 97208f310..333543aaa 100644
--- a/spark-cassandra-connector/src/main/scala/com/datastax/spark/connector/rdd/ReadConf.scala
+++ b/spark-cassandra-connector/src/main/scala/com/datastax/spark/connector/rdd/ReadConf.scala
@@ -1,7 +1,8 @@
 package com.datastax.spark.connector.rdd
 
 import com.datastax.driver.core.ConsistencyLevel
-import com.datastax.spark.connector.util.{ConfigParameter, ConfigCheck, Logging}
+import com.datastax.spark.connector.util.{ConfigCheck, ConfigParameter, Logging}
+import main.scala.com.datastax.spark.connector.writer.LeakyBucketRateLimiterProvider
 import org.apache.spark.SparkConf
 
 /** Read settings for RDD
@@ -97,9 +98,9 @@ object ReadConf extends Logging {
   )
 
   val RateLimiterProviderParam = ConfigParameter[String] (
-    name = "spark.cassandra.read.ratelimiter.provider",
+    name = "spark.cassandra.input.ratelimiterprovider",
     section = ReferenceSection,
-    default = "com.datastax.spark.connector.writer.LeakyBucketProvider",
+    default = new LeakyBucketRateLimiterProvider().getClass.getName,
     description = """Determines which rate limiter provider to use in reads"""
   )
 
diff --git a/spark-cassandra-connector/src/main/scala/com/datastax/spark/connector/util/RateLimiterUtil.scala b/spark-cassandra-connector/src/main/scala/com/datastax/spark/connector/util/RateLimiterUtil.scala
index 8f5cd23f2..03e49f5b5 100644
--- a/spark-cassandra-connector/src/main/scala/com/datastax/spark/connector/util/RateLimiterUtil.scala
+++ b/spark-cassandra-connector/src/main/scala/com/datastax/spark/connector/util/RateLimiterUtil.scala
@@ -1,7 +1,6 @@
 package com.datastax.spark.connector.util
 
 import com.datastax.spark.connector.writer.{BaseRateLimiter, RateLimiterProvider}
-import main.scala.com.datastax.spark.connector.writer.LeakyBucketRateLimiterProvider
 
 /**
   * Exports a method to retrieve a custom rate limiter based on dynamic configuration.
@@ -21,9 +20,17 @@ object RateLimiterUtil extends Logging {
     try {
       provider = Class.forName(className).newInstance.asInstanceOf[RateLimiterProvider]
     } catch {
-      case e:Exception => {
+      case e:ClassNotFoundException => {
+        logError("Could not find custom rate limiter provider. Error: " + e)
+        throw e
+      }
+      case e:InstantiationException => {
         logError("Could not instantiate custom rate limiter provider. Error: " + e)
-        provider = LeakyBucketRateLimiterProvider
+        throw e
+      }
+      case e:Throwable => {
+        logError("Error: " + e)
+        throw e
       }
     }
 
diff --git a/spark-cassandra-connector/src/main/scala/com/datastax/spark/connector/writer/LeakyBucketRateLimiterProvider.scala b/spark-cassandra-connector/src/main/scala/com/datastax/spark/connector/writer/LeakyBucketRateLimiterProvider.scala
index 10b22d52f..1975c78cb 100644
--- a/spark-cassandra-connector/src/main/scala/com/datastax/spark/connector/writer/LeakyBucketRateLimiterProvider.scala
+++ b/spark-cassandra-connector/src/main/scala/com/datastax/spark/connector/writer/LeakyBucketRateLimiterProvider.scala
@@ -6,7 +6,9 @@ import com.datastax.spark.connector.writer.{BaseRateLimiter, LeakyBucketRateLimi
 /**
   * Instantiates a leaky bucket rate limiter based on the supplied configuration.
   */
-object LeakyBucketRateLimiterProvider extends RateLimiterProvider with Logging {
+class LeakyBucketRateLimiterProvider extends RateLimiterProvider with Logging {
+  {}
+
   override def getRateLimiterWithConf(args: Any*): BaseRateLimiter = {
     val rate = args(0).asInstanceOf[Number].longValue
     val bucketSize = args(1).asInstanceOf[Number].longValue
diff --git a/spark-cassandra-connector/src/main/scala/com/datastax/spark/connector/writer/WriteConf.scala b/spark-cassandra-connector/src/main/scala/com/datastax/spark/connector/writer/WriteConf.scala
index 7b03b756c..b33ae40f1 100644
--- a/spark-cassandra-connector/src/main/scala/com/datastax/spark/connector/writer/WriteConf.scala
+++ b/spark-cassandra-connector/src/main/scala/com/datastax/spark/connector/writer/WriteConf.scala
@@ -6,6 +6,7 @@ import com.datastax.spark.connector.rdd.ReadConf
 import com.datastax.spark.connector.types.ColumnType
 import com.datastax.spark.connector.util.{ConfigCheck, ConfigParameter}
 import com.datastax.spark.connector.{BatchSize, BytesInBatch, RowsInBatch}
+import main.scala.com.datastax.spark.connector.writer.LeakyBucketRateLimiterProvider
 import org.apache.commons.configuration.ConfigurationException
 import org.apache.spark.SparkConf
 
@@ -158,9 +159,9 @@ object WriteConf {
   )
 
   val RateLimiterProviderParam = ConfigParameter[String](
-    name = "spark.cassandra.write.ratelimiter.provider",
+    name = "spark.cassandra.output.ratelimiterprovider",
     section = ReferenceSection,
-    default = "com.datastax.spark.connector.writer.LeakyBucketProvider",
+    default = new LeakyBucketRateLimiterProvider().getClass.getName,
     description = """Determines which rate limiter provider to use in writes"""
   )
 
diff --git a/spark-cassandra-connector/src/test/scala/com/datastax/spark/connector/rdd/ReadConfTest.scala b/spark-cassandra-connector/src/test/scala/com/datastax/spark/connector/rdd/ReadConfTest.scala
index 5959a366f..e581bb696 100644
--- a/spark-cassandra-connector/src/test/scala/com/datastax/spark/connector/rdd/ReadConfTest.scala
+++ b/spark-cassandra-connector/src/test/scala/com/datastax/spark/connector/rdd/ReadConfTest.scala
@@ -1,5 +1,6 @@
 package com.datastax.spark.connector.rdd
 
+import com.datastax.spark.connector.writer.WriteConf
 import org.apache.spark.SparkConf
 import org.scalatest.{FlatSpec, Matchers}
 
@@ -27,4 +28,11 @@ class ReadConfTest extends FlatSpec with Matchers {
     readConf.readsPerSec should be (expected)
   }
 
+  it should "allow to set custom rate limiter provider" in {
+    val conf = new SparkConf(false)
+      .set("spark.cassandra.input.ratelimiterprovider", "custom.ratelimiter.provider")
+    val readConf = ReadConf.fromSparkConf(conf)
+    readConf.rateLimiterProvider should be("custom.ratelimiter.provider")
+  }
+
 }
diff --git a/spark-cassandra-connector/src/test/scala/com/datastax/spark/connector/util/RateLimiterUtilSpec.scala b/spark-cassandra-connector/src/test/scala/com/datastax/spark/connector/util/RateLimiterUtilSpec.scala
new file mode 100644
index 000000000..332b21a5c
--- /dev/null
+++ b/spark-cassandra-connector/src/test/scala/com/datastax/spark/connector/util/RateLimiterUtilSpec.scala
@@ -0,0 +1,40 @@
+package com.datastax.spark.connector.util
+
+import java.lang.Thread.sleep
+
+import org.scalamock.scalatest.MockFactory
+import org.scalatest.{FlatSpec, Matchers}
+import com.datastax.spark.connector.writer.{BaseRateLimiter, RateLimiterProvider}
+import main.scala.com.datastax.spark.connector.writer.LeakyBucketRateLimiterProvider
+
+class RateLimiterUtilSpec extends FlatSpec with Matchers {
+
+  "RateLimiterUtil" should "return a custom rate limiter provider should that be specified" in {
+    val mockProvider = new MockProvider()
+    val rateLimiter = RateLimiterUtil.getRateLimiter(mockProvider.getClass.getName)
+    rateLimiter.getClass.getName should equal (mockProvider.getRateLimiterWithConf().getClass.getName)
+  }
+
+  it should "throw an error when custom rate limiter provider cannot be instantiated" in {
+    a [ClassNotFoundException] should be thrownBy RateLimiterUtil.getRateLimiter("non.existing.class")
+    an [InstantiationException] should be thrownBy RateLimiterUtil.getRateLimiter(NonInstantiable.getClass.getName)
+  }
+
+  // mock object that cannot be instantiable
+  object NonInstantiable {}
+}
+
+// mock provider with public constructor that can be instantiated
+class MockProvider extends RateLimiterProvider {
+  {}
+
+  override def getRateLimiterWithConf(args: Any*): BaseRateLimiter = {
+    new MockRateLimiter
+  }
+}
+
+// mock rate limiter that is returned by MockProvider
+class MockRateLimiter extends BaseRateLimiter {
+  override def maybeSleep(packetSize: Long): Unit = {}
+}
+
diff --git a/spark-cassandra-connector/src/test/scala/com/datastax/spark/connector/writer/WriteConfTest.scala b/spark-cassandra-connector/src/test/scala/com/datastax/spark/connector/writer/WriteConfTest.scala
index c4f5887e3..d2b290ccd 100644
--- a/spark-cassandra-connector/src/test/scala/com/datastax/spark/connector/writer/WriteConfTest.scala
+++ b/spark-cassandra-connector/src/test/scala/com/datastax/spark/connector/writer/WriteConfTest.scala
@@ -78,5 +78,12 @@ class WriteConfTest extends FlatSpec with Matchers {
     writeConf.batchGroupingBufferSize should be(30000)
   }
 
+  it should "allow to set custom rate limiter provider" in {
+    val conf = new SparkConf(false)
+      .set("spark.cassandra.output.ratelimiterprovider", "custom.ratelimiter.provider")
+    val writeConf = WriteConf.fromSparkConf(conf)
+    writeConf.rateLimiterProvider should be("custom.ratelimiter.provider")
+  }
+
 
 }

From e2b1c86e0951a258a3de19ad9d452cacad246d5f Mon Sep 17 00:00:00 2001
From: Axel Niklasson <axeln@uber.com>
Date: Tue, 27 Nov 2018 20:46:55 +0100
Subject: [PATCH 5/5] Fixes typo

---
 .../com/datastax/spark/connector/util/RateLimiterUtilSpec.scala | 2 +-
 1 file changed, 1 insertion(+), 1 deletion(-)

diff --git a/spark-cassandra-connector/src/test/scala/com/datastax/spark/connector/util/RateLimiterUtilSpec.scala b/spark-cassandra-connector/src/test/scala/com/datastax/spark/connector/util/RateLimiterUtilSpec.scala
index 332b21a5c..7edf8879d 100644
--- a/spark-cassandra-connector/src/test/scala/com/datastax/spark/connector/util/RateLimiterUtilSpec.scala
+++ b/spark-cassandra-connector/src/test/scala/com/datastax/spark/connector/util/RateLimiterUtilSpec.scala
@@ -20,7 +20,7 @@ class RateLimiterUtilSpec extends FlatSpec with Matchers {
     an [InstantiationException] should be thrownBy RateLimiterUtil.getRateLimiter(NonInstantiable.getClass.getName)
   }
 
-  // mock object that cannot be instantiable
+  // mock object that cannot be instantiated
   object NonInstantiable {}
 }