파이썬(PYTHON) 클린코드 #5_ 인자(Argument)
안녕하세요. 문범우입니다.
이번 포스팅에서는 파이썬에서의 인자(Argument)에 대해서 알아보도록 하겠습니다.
파이썬에서 인자가 어떻게 작동하는지, 그리고 가변인자와 같은 개념들도 함께 알아보도록 하겠습니다.
0. 인자(Argument)와 매개변수(Parameter)
본격적으로 인자에 대해서 알아보기전에, 자주 헷갈릴 수 있는 인자와 매개변수에 대해서 잠깐 짚고 넘어가도록 하자. 물론 이는 파이썬언어 뿐만이 아니라 다른 언어에서도 혼동되서 사용될 수 있는 개념이다.
1 2 3 4 5 | def func1(param1, param2): print(f"param1:{param1}, param2:{param2}") func1("AA","B") # param1:AA, param2:B | cs |
위의 코드를 살펴보며 이야기해보자.
함수 func1에는 param1과 param2가 전달되도록 정의되어있다. 이렇게 함수가 정의되는 내용에 포함되는 특성을 매개변수(Parameter)라고 한다. 즉, 함수 func1는 2개의 매개변수, param1과 param2를 전달받아서 이를 출력하는 기능을 하는 것이다.
그리고 4번 라인에서는 func1에 "AA"라는 값과 "B"라는 값을 전달하며 함수를 호출하고 있다. 이때 함수에 전달하는 값을 인자(Argument)라고 한다.
이러한 차이에 의해서 매개변수(Parameter)는 변수(Variable)로 보아야 하며, 인자(Argument)는 값(Value)로 보아야한다. 두 개념이 비슷하다고 생각할 수 있으나, 함수에 대해서 이야기를 할때에는 구분해서 사용해야 혼동되지 않을 수 있다.
1. 파이썬에서 인자의 전달방식
앞에서 인자에 대해서 설명할 때, 함수를 호출하며 값으로 전달되는 것이라고 설명했다. 하지만 사실 함수에 '값(Value)'로 전달되는 것은 특정 상황에서만이다.
함수에 인자가 전달될 때에는, 실제로 그 값이 넘어가는 "값에 의한 호출(Call by Value)"와 값이 참조하고 있는 참조값이 넘어가는 "참조에 의한 호출(Call by Reference)" 두가지가 존재한다.
(만약 당신이 C언어를 했다면 포인터를 공부하면서 이 개념을 접했을 수도 있다.)
각각의 호출방법이 어떤 차이가 있는지 먼저 코드로 살펴보자.
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 | def call_by_value(param1:int)->None: param1 += 1 print(f"call by value: {param1}") def call_by_ref(param2:list)->None: param2[0] += 1 print(f"call by ref: {param2}") val1 = 3 val2 = [3] print(f"before val1:{val1}") call_by_value(val1) print(f"after val1:{val1}") print("- - - - - - - - - - ") print(f"before val2:{val2}") call_by_ref(val2) print(f"after val2:{val2}") # before val1:3 # call by value: 4 # after val1:3 # - - - - - - - - - - # before val2:[3] # call by ref: [4] # after val2:[4] | cs |
위의 코드에서는 call_by_value 함수와 call_by_ref함수를 정의하여 사용하고 있다. 각각의 함수가 받는 매개변수의 타입은 다르지만, 그 이유에 대해서는 뒤에서 이야기하겠다. 우선 "값에 의한 호출"과 "참조에 의한 호출"에 대한 차이를 이해해보자.
우리가 주목해야 할 것은 19번줄부터 25번줄까지의 결과이다. val1과 val2 모두 함수를 거치기 이전에 출력을 한 다음, 함수 호출시 함수 내부에서 출력한 후에, 함수 호출이 끝난 후에 출력을 한다.
먼저 val1의 값을 보면, 함수 호출 이전에 3이란 값을 출력하고, 함수 내부에서 출력될 때에는 1을 더한 4가 출력되고 있다. 그리고 함수가 끝난 다음에는 값이 변화하지 않고 그대로 3을 출력한다. 즉, 함수에서 더한 1이 val1에 영향을 미치지 않았다.
그럼 이번에는 val2의 값을 살펴보자. 당연히 함수 호출 이전에는 3을 출력했다. 그리고 함수 내부에서 출력될 때에는 1을 더한 4가 출력되었다. 여기까지는 val1과 같았지만, 함수 호출이 끝난 뒤 val2를 출력했을 때에는, val1과 달리 기존의 val2=3값에서 변화가 되어 4를 출력하였음을 볼 수 있다.
즉, val1은 함수에서 내부적으로 1을 더했지만, 기존의 값에 영향을 미치지 않았고, val2는 함수에서 더한 1이 실제 값이 영향을 미쳤다.
이것이 바로 "값에 의한 호출"과 "참조에 의한 호출"에 대한 차이로 발생한 것이다.
값에 의한 호출을 할 때에는, 함수로 인자가 전달될 때 동일한 "값"을 가진 객체를 복사하여 함수에 전달한다. 즉, 위의 코드에서 val1이 call_by_value함수에 전달될 때에는 사실 val1자체가 전달된 것이 아니고, val1이 가진 값을 동일하게 가진 또다른 객체가 함수로 전달된 것이다. 그리고 함수에서 1을 더한것은 val1이 아니고 val1과 똑같은 값을 가진 "val1과 다른 객체"에 더한 것이다. 이로 인해 함수에서 전달받은 값에 대해 변화를 시도해도 기존의 val1값은 변화가 없는 것이다.
이와 달리, 참조에 의한 호출을 할 때에는, 함수로 인자가 전달될 때 실제로 인자가 가진 "참조 값"을 전달한다. 참조 값을 전달한다는 것은 실제로 인자 객체를 그대로 전달한다고 생각해도 된다. 즉, 값에 의한 호출에서와 달리 인자를 복사한 객체를 전달하는 것이 아니라, 말 그대로 인자 그 자체를 전달하는 것이다. 따라서 함수내부에서 전달받은 인자에 대해 변화를 주면, 실제로 그 인자에 영향이 있게 된다.
이것이 "값에 의한 호출"과 "참조에 의한 호출"의 차이이다.
C언어의 경우에는 인자를 값에 의한 호출로 전달할 것인지, 참조에 의한 호출로 전달할 것인지를 명시적으로 정해줄 수 있다. 하지만 파이썬 같은 경우는 이를 명시적으로 나타내지 않는다.
그럼 파이썬에서는 "값에 의한 호출"과 "참조에 의한 호출"을 어떻게 구분할 수 있을까?
위의 코드를 통해 짐작했을 수도 있다. 파이썬에서는 따로 호출에 대한 명시적인 구분을 두지 않고, 함수에 전달되는 인자의 타입(type)에 의해서 결정된다.
변수 타입에는 불변형(immutable) 객체와, 가변형(mutable) 객체가 있다. 즉 값의 수정이 허용되지 않는 변수 타입이 있으며, 값의 수정이 허용되는 변수 타입이 있다.
이를 통해, 함수에 전달되는 인자가 불변형 객체, 값의 수정이 허용되지 않는 변수타입이라면 이는 "값에 의한 호출"로 함수에 전달된다. 하지만 함수에 전달되는 인자가 가변형 객체, 값의 수정이 허용되는 변수타입이라면 이는 "참조에 의한 호출"로 함수에 전달된다.
때문에 이를 파이썬 공식 문서에서는 call by value나 call by reference라는 설명이 아닌, call by assignment라고 설명하고 있다. 함수에 할당되는 변수의 타입에 따라서 그 방식이 달라지기 때문이다.
파이썬에서 불변형객체, 가변형객체는 아래와 같이 나뉜다.
* 불변형(immutable) 객체
int, float, str, tuples 등
* 가변형(mutable) 객체
list, set, dict 등
2. 가변 인자
파이썬에서는 다른 언어와 같이, 가변인자 함수를 지원한다. 가변인자 함수라 함은 인자의 개수가 정해지지 않은 함수라고 생각하면 된다.
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 | def args_test_func1(a, b, c): print("* call args_test_func1") print(f"a:{a}, b:{b}, c:{c}, a+b+c:{a+b+c}") print("* END args_test_func1", end='\n\n') def args_test_func2(a, b, *args): print("* call args_test_func2") print(f"a:{a}, b:{b}, args:{args}, a+b+c:{a+b+sum(args)}") print("* END args_test_func2", end='\n\n') args_test_func1(1,2,3) args_test_func2(1,2,3) args_test_func2(1,2,3,4,5,6) # * call args_test_func1 # a:1, b:2, c:3, a+b+c:6 # * END args_test_func1 # * call args_test_func2 # a:1, b:2, args:(3,), a+b+c:6 # * END args_test_func2 # * call args_test_func2 # a:1, b:2, args:(3, 4, 5, 6), a+b+c:21 # * END args_test_func2 | cs |
위의 코드에서 2개의 함수를 정의했다. args_test_func1 함수는 우리가 기존에 보던 함수처럼 a,b,c 3개의 매개변수를 정의한 함수이다. 아래 결과에서도 3개의 인자를 전달해 함수가 올바르게 기능했다.
이와 달리 args_test_func2 함수에서는 a,b라는 매개변수와 함께, *args 라는 매개변수를 정의하였다. 이렇게 *를 이용한 매개변수는 가변인자를 받을 수 있는 것으로 해석된다. 즉, 개수가 정해지지 않은 인자를 args라는 이름으로 받아서 처리하겠다는 것이다.
실제로 13번 줄에서 3개 이상의 인자를 함수에 전달했는데, 3부터 6까지는 args라는 이름으로 받아서 처리한 것을 볼 수 있다. 약간의 차이점은 args로 받은 인자는 튜플로 받아서 처리했다는 점이다.
이렇게 *를 사용하는 것을 패킹(packing)한다고 말하기도 하는데, 다음의 코드를 보면 그 의미가 더 와닿을 것이다.
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 | def packing_func1(a, b, c): print(f"a:{a}, b:{b}, c:{c}, a+b+c:{a+b+c}") packing_list = [1,2,3] packing_func1(packing_list) # --------------------------------------------------------------------------- # TypeError Traceback (most recent call last) # <ipython-input-15-aaa44dbee827> in <module> # 3 # 4 packing_list = [1,2,3] # ----> 5 packing_func1(packing_list) # TypeError: packing_func1() missing 2 required positional arguments: 'b' and 'c' packing_func1(*packing_list) # a:1, b:2, c:3, a+b+c:6 | cs |
packing_func1은 이전와 같이 3개의 매개변수를 정의한 함수이다. 그리고 이 함수를 호출하기 위해 3개의 int값을 가지는 리스트, packing_list를 정의했다. 그리고 해당 리스트를 그대로 인자로 전달하면 에러가 발생한다. 타입의 맞고 틀림을 떠나서, packing_func1에서는 3개의 인자가 필요한데, 1개의 인자만 전달했기 때문이다.
이를 해결하기 위해서는 파이썬의 *를 이용한 패킹 기법을 사용하면 된다. 즉, 15번 줄과 같이 packing_list를 *를 통해 패킹함으로써 3개의 인자에 대응하는 값을 전달할 수 있다.
3. 가변 키워드 인자
가변 키워드 인자는 위에서 알아본 가변 인자와 비슷하다. 가변인자에서는 별표( * )를 하나 사용했지만, 가변 키워드 인자에서는 별표( * )를 2개 사용한다.
1 2 3 4 5 | def kwargs_test_func1(**kwagrs): print(f"kwagrs:{kwagrs}") kwargs_test_func1(key="value", test="wow") # kwagrs:{'key': 'value', 'test': 'wow'} | cs |
가변 키워드 인자가 가변 인자 개념과 다른 점은, **kwagrs로 정의된 매개변수는 인자로 받은 값을 "딕셔너리"형태로 패킹한다는 것이다.
따라서 **가 붙은 매개변수는 딕셔너리형태로 함수 내에서 활용할 수 있다.
또한 가변 인자에서와 같이, 기존의 딕셔너리 자료형을 함수에 전달할 때, 다음과 같이 사용할 수 있다.
1 2 3 4 5 6 7 8 9 | def kwargs_test_func2(a, b, c): print(f"a:{a}, b:{b}, c:{c}, a+b+c:{a+b+c}") kwagrs_dict = { 'a': 1, 'b': 2, 'c': 3 } kwargs_test_func2(**kwagrs_dict) # a:1, b:2, c:3, a+b+c:6 | cs |