Aerospike - Python Benchmark

Benjamin_Cabalona_Jr · December 13, 2019, 2:07am

I was performing a NoSQL performance benchmark for a client. I was wondering if my Aerospike Python code is optimal? I’m trying to record query time and load time. The data has 500,000 rows and 8 columns. My code is below.

def test_db():

    config = {
      'hosts': [ ('127.0.0.1', 3000)  ]
    }

    client = aerospike.client(config).connect()

    t0 = time.time()
    global rec
    rec = {}
    with open('skunkworks.csv', 'r') as f:
        reader = csv.reader(f)
        rownum = 0
        for row in reader:
            # Save First Row with headers
            if rownum == 0:
                header = row
            else:
                colnum = 0
                for col in row:
                    rec[header[colnum]] = col
                    colnum += 1
            rownum += 1
            if rec:
                client.put(('test', 'demo', str(rownum)), rec)
            rec = {}

    t1 = time.time()
    load_time = t1 - t0

    t2 = time.time()
    for i in range(2,500002):
        (key, metadata, record) = client.get(('test', 'demo', str(i)))
        # print(record)
    t3 = time.time()

    read_time = t3 - t2


    return [load_time , read_time]

kporter · December 13, 2019, 2:48am

Cross posted to SO: performance - Aerospike - Python Client - NoSQL benchmark - Stack Overflow

Topic		Replies	Views
Aerospike learning - writing many keys slow performance Python Client	10	1809	October 28, 2021
Aerospike Benchmark POC Aerospike Server Benchmarks	7	3793	December 10, 2015
Aerospike Benchmark Tool Help Aerospike Server Benchmarks benchmark	3	1190	February 18, 2020
Bucketing / splitting data	3	1821	October 27, 2021
Aerospike batch requests performance tuning Tuning	13	1712	November 18, 2022

Aerospike - Python Benchmark

Related topics